OpenAI ประกาศเปิดตัวโมเดล GPT-4o (Omni) เป็นโมเดลภาษาที่มีความโดดเด่นเรื่องการประมวลผลอินพุตภาพและเสียง แบบเรียลไทม์ โดยเป็นโมเดลที่เปิดให้ใช้งานได้ฟรีไม่ต้องจ่าย ChatGPT Plus พร้อมกับเปิดตัวแอปฯ ChatGPT เวอร์ชันเดสก์ท็อป

ในด้านความสามารถของ GPT-4o เป็นโมเดลที่ได้รับการปรับปรุงจาก GPT-4 เรียนรู้ได้ทั้งภาพและเสียง โดยนักพัฒนาที่ต้องการเข้าถึง API โมเดล GPT-4o จะมีค่าใช้จ่ายที่ถูกกว่าครึ่งหนึ่ง และมีความเร็วในการประมวลผลมากกว่า GPT-4 Turbo ซึ่งสูงกว่า 5 เท่า

ของใหม่สำหรับ ChatGPT คือ การปรับปรุงโหมดคำสั่งเสียง (Voice Mode) ที่สามารถประมวลผลได้แบบเรียลไทม์ และตอบสนองได้ไวกว่าเดิม โดยตัวแอปฯ ยังสามารถทำหน้าที่ได้เหมือนผู้ช่วยคำสั่งเสียง และผู้ใช้สามารถโต้ตอบระหว่างที่ ChatGPT กำลังตอบกลับได้ด้วย เรียกได้ว่ามีความเป็นธรรมชาติเหมือนกำลังคุยกับคนจริง ๆ

ทดสอบ แปลภาษาแบบเรียลไทม์ ผ่าน GPT-4o
ทดสอบ ผู้ช่วยระหว่างการเขียนโคด
ทดสอบ เป็นกรรมการการแข่ง เป่ายิ้งฉุบ (ค้อน,กรรไกร,กระดาษ)
ทดสอบ เป็นผู้ช่วยสำหรับผู้บกพร่องการมองเห็น

นอกเหนือการเปิดตัวโมเดล GPT-4o ตัวใหม่ ทาง OpenAI ยังได้เปิดตัวแอปฯ ChatGPT เวอร์ชันเดสก์ท็อป macOS โดยที่ผู้ใช้สามารถเรียก ChatGPT ได้ง่ายด้วยคำสั่งแป้นพิมพ์ลัด Option + Space และแอปฯ เวอร์ชันเดสก์ท็อปยังสามารถประมวลผลภาพบนหน้าจอ และสนทนาผ่านคำสั่งเสียงได้ด้วย โดยจะปล่อยให้โหลดใช้งานเร็ว ๆ นี้