ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
Alibaba

Alibaba ‘EMO’ โมเดล AI สร้างวิดีโอร้องเพลงได้จากรูปภาพ แสดงสีหน้าได้แบบสมจริง!

Table of Content

สถาบัน Intelligent Computing ของ Alibaba ได้เปิดตัว ‘EMO’ (Emote Portrait Alive) โมเดล AI ที่สามารถสร้างวิดีโอร้องเพลงหรือการพูดได้จากภาพเพียงภาพเดียว

สำหรับ EMO เป็นเป็นเทคโนโลยี ‘Expressive Audio-Driven Portrait-Video Generation Framework’ ที่เราสามารถใส่รูปกับเสียงเข้าไป แล้วตัว AI จะเปลี่ยนภาพนิ่งใบนั้นเป็นวิดีโอที่ขยับพูดคุยหรือร้องเพลงได้ตรงกับเสียงที่เราใส่เข้าไปนั้นเองครับ แถมไม่ได้เป็นการขยับปากให้ตรงกับเสียงเฉย ๆ แต่ยังมีการแสดงสีหน้าอารมณ์ที่สมจริงด้วย โดยสามารถสร้างวิดีโอที่ความยาวสูงสุด 1 นาที 30 วินาที

Alibaba

ตัว EMO ยังรองรับการใช้งานในหลากหลายภาษา และใช้งานได้กับสไตล์ศิลปะหลายหลายประเภทเลยครับ ไม่ว่าจะเป็นภาพถ่าย ภาพวาด หรือแม้กระทั้งอนิเมะ และ 1 ในตัวอย่างที่ทีมทำออกมาโชว์ดูเหมือนเป็นการข้ามค่ายหน่อย ๆ ก็คือการนำภาพผู้หญิงใส่แว่นกันแดดในการเปิดตัวของ OpenAi ‘Sora’ มาร้องเพลง ‘Don’t Start Now’ ของ ดูอา ลิปา (Dua Lipa)

รายละเอียดการวิจัยทั้งหมดของ EMO สามารถดูได้ที่เว็บไซต์ Github พร้อมกับบทความวิจัยที่เกี่ยวข้องที่ ArXiv ครับ

Highlight

เบื้องหลัง BMO Stadium ทำไมศิลปินระดับโลกเลือกจัดคอนเสิร์ตสนามนี้ ?

23/04/2026
Read More

TWINEHIDE x NANAKE555 เปิดตัว “Standing MagSafe Wallet” พรีเมียมแอ็กเซสซอรีงานคราฟต์สุดลิมิเต็ด

23/04/2026
Read More

ครบรอบ 21 ปี วิดีโอแรกที่ถูกอัปโหลดขึ้น YouTube !

22/04/2026
Read More

Meta เตรียมเก็บข้อมูล คลิก-พิมพ์ ของพนักงาน ไปเทรน AI ให้เก่งกว่าคน ?

22/04/2026
Read More

ซื้อตั๋วด่วน ! ชมภาพยนตร์ Michael รอบพิเศษ ที่จะชวนคุณมาคุยเรื่อง “ไมเคิล แจ็กสัน” หลังหนังจบกันแบบออกรส รอบเดียว 26 เม.ย. นี้ เท่านั้น

22/04/2026
Read More

ทิ้งให้ถูกที่ ดีต่อโลก ดีต่อใจ ! เปลี่ยนขยะ E-Waste เป็นสิทธิพิเศษง่าย ๆ กับ True App

22/04/2026
Read More

Related Content