ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
Alibaba

Alibaba ‘EMO’ โมเดล AI สร้างวิดีโอร้องเพลงได้จากรูปภาพ แสดงสีหน้าได้แบบสมจริง!

Table of Content

สถาบัน Intelligent Computing ของ Alibaba ได้เปิดตัว ‘EMO’ (Emote Portrait Alive) โมเดล AI ที่สามารถสร้างวิดีโอร้องเพลงหรือการพูดได้จากภาพเพียงภาพเดียว

สำหรับ EMO เป็นเป็นเทคโนโลยี ‘Expressive Audio-Driven Portrait-Video Generation Framework’ ที่เราสามารถใส่รูปกับเสียงเข้าไป แล้วตัว AI จะเปลี่ยนภาพนิ่งใบนั้นเป็นวิดีโอที่ขยับพูดคุยหรือร้องเพลงได้ตรงกับเสียงที่เราใส่เข้าไปนั้นเองครับ แถมไม่ได้เป็นการขยับปากให้ตรงกับเสียงเฉย ๆ แต่ยังมีการแสดงสีหน้าอารมณ์ที่สมจริงด้วย โดยสามารถสร้างวิดีโอที่ความยาวสูงสุด 1 นาที 30 วินาที

Alibaba

ตัว EMO ยังรองรับการใช้งานในหลากหลายภาษา และใช้งานได้กับสไตล์ศิลปะหลายหลายประเภทเลยครับ ไม่ว่าจะเป็นภาพถ่าย ภาพวาด หรือแม้กระทั้งอนิเมะ และ 1 ในตัวอย่างที่ทีมทำออกมาโชว์ดูเหมือนเป็นการข้ามค่ายหน่อย ๆ ก็คือการนำภาพผู้หญิงใส่แว่นกันแดดในการเปิดตัวของ OpenAi ‘Sora’ มาร้องเพลง ‘Don’t Start Now’ ของ ดูอา ลิปา (Dua Lipa)

รายละเอียดการวิจัยทั้งหมดของ EMO สามารถดูได้ที่เว็บไซต์ Github พร้อมกับบทความวิจัยที่เกี่ยวข้องที่ ArXiv ครับ

Highlight

เปิดตัว ‘iOS 27’ iPhone 11 ยังใช้ได้อยู่ไหม แล้วรุ่นไหนไม่ได้ไปต่อ ?

09/06/2026
Read More

WWDC 2026 MOMENT มีอะไรว้าว ? BT beartai รีแคปโมเมนต์สุดประทับใจ

09/06/2026
Read More

มัตจะ ก็มีเกรด ! ส่องความต่างของมัตจะ ทำไมคนรักชาถึงยอมจ่ายแพง ?

09/06/2026
Read More

แห่งปี ! สรุปจบ WWDC 2026 อะไรใหม่ อะไรมา และอะไรที่ไทยไม่มี ?

09/06/2026
Read More

ซีพี แอ็กซ์ตร้า ร่วมโครงการ “ฮักโลก (Hug The Earth) ” พร้อมเดินหน้า “เปลี่ยนขยะ เป็นประโยชน์” สร้างคุณค่าจากอาหารส่วนเกิน

09/06/2026
Read More

BYD SEALION-5 DM-i ฝ่ารถติดทั่วกรุงเทพใน 4 ชั่วโมง ประหยัดแค่ไหน ?

09/06/2026
Read More

Related Content