ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
Alibaba

Alibaba ‘EMO’ โมเดล AI สร้างวิดีโอร้องเพลงได้จากรูปภาพ แสดงสีหน้าได้แบบสมจริง!

Table of Content

สถาบัน Intelligent Computing ของ Alibaba ได้เปิดตัว ‘EMO’ (Emote Portrait Alive) โมเดล AI ที่สามารถสร้างวิดีโอร้องเพลงหรือการพูดได้จากภาพเพียงภาพเดียว

สำหรับ EMO เป็นเป็นเทคโนโลยี ‘Expressive Audio-Driven Portrait-Video Generation Framework’ ที่เราสามารถใส่รูปกับเสียงเข้าไป แล้วตัว AI จะเปลี่ยนภาพนิ่งใบนั้นเป็นวิดีโอที่ขยับพูดคุยหรือร้องเพลงได้ตรงกับเสียงที่เราใส่เข้าไปนั้นเองครับ แถมไม่ได้เป็นการขยับปากให้ตรงกับเสียงเฉย ๆ แต่ยังมีการแสดงสีหน้าอารมณ์ที่สมจริงด้วย โดยสามารถสร้างวิดีโอที่ความยาวสูงสุด 1 นาที 30 วินาที

Alibaba

ตัว EMO ยังรองรับการใช้งานในหลากหลายภาษา และใช้งานได้กับสไตล์ศิลปะหลายหลายประเภทเลยครับ ไม่ว่าจะเป็นภาพถ่าย ภาพวาด หรือแม้กระทั้งอนิเมะ และ 1 ในตัวอย่างที่ทีมทำออกมาโชว์ดูเหมือนเป็นการข้ามค่ายหน่อย ๆ ก็คือการนำภาพผู้หญิงใส่แว่นกันแดดในการเปิดตัวของ OpenAi ‘Sora’ มาร้องเพลง ‘Don’t Start Now’ ของ ดูอา ลิปา (Dua Lipa)

รายละเอียดการวิจัยทั้งหมดของ EMO สามารถดูได้ที่เว็บไซต์ Github พร้อมกับบทความวิจัยที่เกี่ยวข้องที่ ArXiv ครับ

Highlight

SpaceX หุ้น IPO จองล้นทะลักเกือบ 4 เท่า มูลค่าทะลุ 2.5 แสนล้านเหรียญสหรัฐฯ

10/06/2026
Read More

Nasa เปิดชื่อนักบินอวกาศสำหรับ Artemis III

10/06/2026
Read More

ถูกใจสายคุมโทน ฟีเจอร์ใหม่ IG ย้าย Grid จัดเรียงโพสต์ที่ลงไปแล้วได้ !

10/06/2026
Read More

SITE 2026: ก้าวข้ามงานจัดแสดงนวัตกรรม สู่เวทีเชื่อมโยง “สตาร์ตอัปไทย” และนักลงทุนระดับโลก

10/06/2026
Read More

เปิดตัว ‘iOS 27’ iPhone 11 ยังใช้ได้อยู่ไหม แล้วรุ่นไหนไม่ได้ไปต่อ ?

09/06/2026
Read More

WWDC 2026 MOMENT มีอะไรว้าว ? BT beartai รีแคปโมเมนต์สุดประทับใจ

09/06/2026
Read More

Related Content