OpenAI เปิดตัวเครื่องมือ AI ใหม่ในรูปแบบ text-to-voice หรือเรียกว่า Voice Engine โดยอาศัยเสียงตัวอย่างที่มีความยาวอย่างน้อย 15 วินาที

ปัจจุบันการเข้าถึงการใช้งานสร้างเสียงจาก AI นั้น ยังถูกจำกัดเฉพาะกลุ่ม ได้แก่ บริษัทเทคโนโลยีการศึกษา-Age of Learning, แพลตฟอร์มการเล่าเรื่องด้วยภาพ-HeyGen, ผู้ผลิตซอฟต์แวร์ด้านสุขภาพ-Dimagi, ผู้สร้างแอปสื่อสาร AI Livox และระบบสุขภาพ-Lifespan

ทาง OpenAI ได้ลงตัวอย่างคลิปเสียงที่สร้างขึ้นโดย OpenAI โดยมีตัวอย่างเป็นคลิปเสียงต้นแบบ จากนั้น AI ก็สร้างเสียงขึ้นมาที่เหมือนกับต้นแบบเอามาก ๆ

คลิปเสียงต้นแบบ

เสียงที่สร้างขึ้นโดย AI

OpenAI บอกว่าบริษัทได้เริ่มพัฒนา Voice Engine ตั้งแต่ช่วงปลายปี 2022 ซึ่ง เจฟฟ์ แฮร์ริส (Jeff Harris) หนึ่งในทีมพัฒนาของ OpenAI เผยว่าเทคโนโลยีดังกล่าวผ่านการฝึกซ้อมกับข้อมูลที่เป็นสาธารณะและข้อมูลที่ได้รับอนุญาตแล้วเท่านั้น โดยโมเดลนี้จะอนุญาตให้นักพัฒนาราว 10 คนเท่านั้นที่สามารถเข้าถึงได้

การสร้างเสียงด้วยระบบ text-to-audio อยู่ในขอบเขตของ Generative AI ที่มีการพัฒนาอย่างต่อเนื่อง แม้ว่าบริษัทหรือนักพัฒนาส่วนใหญ่จะเน้นไปที่เสียงเครื่องดนตรีหรือเสียงที่เป็นธรรมชาติ แต่มีน้อยคนนักที่ให้ความสนใจเรื่องการสร้างเสียงขึ้นมา