Gemini Omni โมเดล AI มัลติโมดัลเจเนอเรชันใหม่จาก Google รอบที่แล้วทำให้หลายคนฮือฮากับ Nanobanana ปีนี้ก็น่าจะเป็นผู้ช่วยสร้างวิดีโอตัวนี้ เพราะนอกจากความสามารถในการสร้างวิดีโอแล้ว Gemini Omni ได้ผสานความสามารถในการคิดวิเคราะห์เข้ากับการสร้างสรรค์เข้าด้วยกัน มาดูว่า 4 เรื่องที่คุณต้องรู้เกี่ยวกับ Gemini Omni มีอะไรบ้าง ?
1. การสร้างและแก้ไขวิดีโออัจฉริยะ
- สร้างวิดีโอจากข้อมูลทุกรูปแบบ: สามารถผสมผสานข้อมูลนำเข้า (Input) ทั้ง ข้อความ รูปภาพ เสียง และวิดีโอ เพื่อสร้างออกมาเป็นวิดีโอคุณภาพสูงชิ้นเดียวได้อย่างกลมกลืน
- แก้ไขวิดีโอผ่านการสนทนา (Conversational Editing): สามารถสั่งแก้ไขวิดีโอเพิ่มได้เรื่อย ๆ ด้วยภาษาธรรมชาติเหมือนสั่งแก้งานทีมตัดต่อ โดย AI จะจดจำบริบทเดิม ทำให้ตัวละคร สภาพแวดล้อม และมุมกล้องมีความต่อเนื่อง ไม่หลุดธีม
- ปรับแต่งและเปลี่ยนโลกในวิดีโอ (Reimagine & Transform): สามารถสั่งเปลี่ยนวัตถุในวิดีโอ (เช่น เปลี่ยนรูปปั้นเป็นฟองสบู่) เพิ่มตัวละครใหม่ หรือเปลี่ยนสไตล์ภาพให้กลายเป็นแนวไซไฟหรือเรโทรฟิวเจอร์ได้ตามจินตนาการผ่านพรอมต์ง่าย ๆ

2. การประมวลผลด้วยเหตุผลและคลังความรู้ระดับโลก
- ระบบฟิสิกส์ที่สมจริง (Accurate Physics): มีความเข้าใจเรื่องแรงโน้มถ่วง พลังงานจลน์ และพลศาสตร์ของของไหล ทำให้สร้างฉากเคลื่อนไหว เช่น ลูกแก้วกลิ้งบนราง การไหลของน้ำ หรือโมเมนตัมของสิ่งของที่มีน้ำหนักต่างกันได้อย่างแม่นยำตามหลักความเป็นจริง
- ผสานความรู้กับความคิดสร้างสรรค์: เชื่อมโยงภาษา ภาพ และความหมายเชิงลึกได้ดีกว่าแค่การจับคู่แพทเทิร์นทั่วไป สามารถทำตามคำสั่งที่มีเงื่อนไขซับซ้อนได้ (เช่น การไล่ลำดับอักษร 26 ตัวพร้อมเงื่อนไขรายละเอียดในแต่ละเฟรม)
- ย่อยเรื่องยากให้เห็นเป็นภาพ (Complex Ideas Made Visual): สามารถสร้างวิดีโออธิบายเรื่องราวเชิงวิทยาศาสตร์หรือประวัติศาสตร์ที่เข้าใจยาก (เช่น การม้วนพับของโปรตีน) ออกมาเป็นภาพแอนิเมชันสตอปโมชันที่เข้าใจง่าย

3. อวตารดิจิทัลส่วนบุคคล
ความสามารถนี้อาจเป็นจุดเปลี่ยนของครีเอเตอร์ยุคปัจจุบัน เพราะเราสามารถสร้าง อวตารดิจิทัล (Digital Avatar) ที่มีทั้งรูปลักษณ์และน้ำเสียงเหมือนตัวอง เพื่อใช้ในการสร้างสรรค์วิดีโอต่าง ๆ โดยไม่ต้องถ่ายทำจริงผ่าน Gemini Omni ได้ แม้ว่าก่อนหน้านี้ AI จากฝั่งจีนหลายตัวจะทำออกมาได้ดีมาก ๆ แต่สำหรับ Gemini ที่มีผู้ใช้หลายล้านคนทั่วโลกอาจเปลี่ยนโฉมวงการครีเอเตอร์ได้เลย

4. ความปลอดภัยและความโปร่งใส (Responsibility & Transparency)
ทาง Google ยังคงฝังลายน้ำดิจิทัล หรือ SynthID ในวิดีโอทุกตัวที่สร้างด้วย Gemini Omni ซึ่งจะฝังไว้และไม่สามารถมองเห็นด้วยตาเปล่า เพื่อความโปร่งใสและการตรวจสอบที่ง่ายแอปพลิเคชัน Gemini, Gemini ใน Chrome และ Google Search
ตอนนี้ Gemini Omni Flash ได้เปิดให้บริการแล้วทั่วโลก ซึ่งคาดว่า Gemini Omni Pro จะเปิดตัวตามมาในเดือนมิถุนายน 2026 นี้











