ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
Alibaba

Alibaba ‘EMO’ โมเดล AI สร้างวิดีโอร้องเพลงได้จากรูปภาพ แสดงสีหน้าได้แบบสมจริง!

Table of Content

สถาบัน Intelligent Computing ของ Alibaba ได้เปิดตัว ‘EMO’ (Emote Portrait Alive) โมเดล AI ที่สามารถสร้างวิดีโอร้องเพลงหรือการพูดได้จากภาพเพียงภาพเดียว

สำหรับ EMO เป็นเป็นเทคโนโลยี ‘Expressive Audio-Driven Portrait-Video Generation Framework’ ที่เราสามารถใส่รูปกับเสียงเข้าไป แล้วตัว AI จะเปลี่ยนภาพนิ่งใบนั้นเป็นวิดีโอที่ขยับพูดคุยหรือร้องเพลงได้ตรงกับเสียงที่เราใส่เข้าไปนั้นเองครับ แถมไม่ได้เป็นการขยับปากให้ตรงกับเสียงเฉย ๆ แต่ยังมีการแสดงสีหน้าอารมณ์ที่สมจริงด้วย โดยสามารถสร้างวิดีโอที่ความยาวสูงสุด 1 นาที 30 วินาที

Alibaba

ตัว EMO ยังรองรับการใช้งานในหลากหลายภาษา และใช้งานได้กับสไตล์ศิลปะหลายหลายประเภทเลยครับ ไม่ว่าจะเป็นภาพถ่าย ภาพวาด หรือแม้กระทั้งอนิเมะ และ 1 ในตัวอย่างที่ทีมทำออกมาโชว์ดูเหมือนเป็นการข้ามค่ายหน่อย ๆ ก็คือการนำภาพผู้หญิงใส่แว่นกันแดดในการเปิดตัวของ OpenAi ‘Sora’ มาร้องเพลง ‘Don’t Start Now’ ของ ดูอา ลิปา (Dua Lipa)

รายละเอียดการวิจัยทั้งหมดของ EMO สามารถดูได้ที่เว็บไซต์ Github พร้อมกับบทความวิจัยที่เกี่ยวข้องที่ ArXiv ครับ

Highlight

จดโน้ตลง PDF บน Google Chrome ไม่ต้องลงแอปฯ เพิ่ม

06/03/2026
Read More

โดนใจสายส่อง ! ฟีเจอร์ใหม่ IG ส่องสตอรี่ แต่ไม่ขึ้นว่าดู

06/03/2026
Read More

ประกาศรางวัลผู้ได้รับรางวัล SDGs Awards ใน The 2nd BT Awards: The Impact Makers

06/03/2026
Read More

ตุนน้ำมันผิดวิธีอันตราย เปิดวิธีเก็บน้ำมันให้ปลอดภัยต้องทำยังไง ?

06/03/2026
Read More

เทียบความต่างระหว่าง iPhone 16e VS iPhone 17e เลือกซื้ออะไรคุ้มสุด ?

06/03/2026
Read More

COMMART GAMEFORCE 2026 ช้อปสนั่น มันเต็มแม็กซ์ 5 – 8 มีนาคม 2569

06/03/2026
Read More

Related Content