ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Alibaba
Read

Alibaba ‘EMO’ โมเดล AI สร้างวิดีโอร้องเพลงได้จากรูปภาพ แสดงสีหน้าได้แบบสมจริง!

Tabel of Content

สถาบัน Intelligent Computing ของ Alibaba ได้เปิดตัว ‘EMO’ (Emote Portrait Alive) โมเดล AI ที่สามารถสร้างวิดีโอร้องเพลงหรือการพูดได้จากภาพเพียงภาพเดียว

สำหรับ EMO เป็นเป็นเทคโนโลยี ‘Expressive Audio-Driven Portrait-Video Generation Framework’ ที่เราสามารถใส่รูปกับเสียงเข้าไป แล้วตัว AI จะเปลี่ยนภาพนิ่งใบนั้นเป็นวิดีโอที่ขยับพูดคุยหรือร้องเพลงได้ตรงกับเสียงที่เราใส่เข้าไปนั้นเองครับ แถมไม่ได้เป็นการขยับปากให้ตรงกับเสียงเฉย ๆ แต่ยังมีการแสดงสีหน้าอารมณ์ที่สมจริงด้วย โดยสามารถสร้างวิดีโอที่ความยาวสูงสุด 1 นาที 30 วินาที

Alibaba

ตัว EMO ยังรองรับการใช้งานในหลากหลายภาษา และใช้งานได้กับสไตล์ศิลปะหลายหลายประเภทเลยครับ ไม่ว่าจะเป็นภาพถ่าย ภาพวาด หรือแม้กระทั้งอนิเมะ และ 1 ในตัวอย่างที่ทีมทำออกมาโชว์ดูเหมือนเป็นการข้ามค่ายหน่อย ๆ ก็คือการนำภาพผู้หญิงใส่แว่นกันแดดในการเปิดตัวของ OpenAi ‘Sora’ มาร้องเพลง ‘Don’t Start Now’ ของ ดูอา ลิปา (Dua Lipa)

รายละเอียดการวิจัยทั้งหมดของ EMO สามารถดูได้ที่เว็บไซต์ Github พร้อมกับบทความวิจัยที่เกี่ยวข้องที่ ArXiv ครับ

ที่มา : PetaPixel

Highlight

มุมมองผู้นำยุคใหม่ของ “ศุภชัย เจียรวนนท์” เมื่อการเติบโตของธุรกิจ ต้องตอบโจทย์ระดับประเทศ

17/01/2026
Read More

สัมผัสแรก Airbus A321neo ความสบายใหม่จากการบินไทยที่ต้องไปลอง

16/01/2026
Read More

SYNNEX เปิดบ้านจัดงาน “SYNNEX OPEN HOUSE 2026” ประกาศทิศทางกลยุทธ์ยุค AI มุ่งสู่เป้าหมายรายได้ 53,000 ล้านบาท

16/01/2026
Read More

GPO Pharmaceutical Summit 2026 : ปักธงไทยสู่ Global Innovation Gateway ยกระดับความมั่นคงทางยาระดับสากล

16/01/2026
Read More

ทางรอดสายปั่นเทรนด์ ! วิธีแก้เกมดันแฮชแท็กบน X ให้ติดอันดับ หลังอัลกอริทึมเปลี่ยนทำยอดหาย

16/01/2026
Read More

จบปัญหากระเป๋าล้น ! ญี่ปุ่นเปิดตัว “เครื่องบีบอัดเสื้อผ้า” ย่อส่วนเหลือเท่าฝ่ามือใน 1 นาที

16/01/2026
Read More

Related Content