ปัญหาที่คนใช้ AI เจ้าใหญ่ ๆ อย่าง ChatGPT, Gemini หรือตัว Llama พบเจอ คือ AI เหล่านี้ชอบหลอนบ่อย ๆ ก่อนหน้านี้ก็มีข่าวเรื่องความหลอนจนสร้างความเสียหายต่อชื่อเสียงคนมากมาย ซึ่งแม้ว่าภายหลังจะมีคำเตือนแจ้งไว้ว่าให้ไปเช็กข้อมูลเพิ่มเติมเอง แต่ก็ยังหนีไม่พ้นปัญหานี้อยู่ดี แล้วยิ่งกว่าคือจะแก้ปัญหาอย่างไรในเมื่อเราไม่สามารถตามแทร็กย้อนหาข้อผิดพลาดนี้ได้ ?
ปัญหาที่ตามมาแน่ ๆ คือเมื่อปัญหา AI หลอนยังถูกแก้ไม่ได้ การเข้ามาของ Agentic AI มันจะน่าเชื่อถือได้มากแค่ไหนกัน เพราะ Agentic AI เป็น AI ที่ถูกออกแบบมาเพื่อสเกลพรอมต์ที่ใหญ่กว่า เช่น จองโรงแรม จองตั๋ว จัดการการเงิน ซึ่งหากยังไม่สามารถแก้ประเด็น AI Hallucination หรือ AI หลอนก็จะมีปัญหาตามมาที่มากกว่าแค่ข้อความผิดเพี้ยนจากความจริง แต่ยังเป็นความผิดพลาดทางการเงินด้วย
ปัญหาของ AI ปัจจุบัน : ข้อมูลเทียมและควบคุมยาก
โมเดลภาษาขนาดใหญ่ (LLMs) ใช้เทคนิค ‘Deep Learning’ ในการเก็บเอาข้อมูลเยอะ ๆ และรูปแบบการเดาสถานการณ์ต่าง ๆ แบบมนุษย์มาไว้ใช้งาน แต่ปัญหาคือพอเป็นแบบนี้ข้อมูลที่ได้อาจทำให้ผู้ใช้เข้าใจผิดได้ง่ายขึ้นมาก เพราะความสามารถในการเดาไปก่อน ไม่ใช่การเข้าใจอย่างแท้จริง
ตอนนี้ AI ถูกวิจารณ์เรื่องการใช้พลังงานมากเกินไป และยังเสี่ยงต่อการให้ข้อมูลผิด ๆ ถึงแม้จะใช้มนุษย์ควบคุมเพื่อตัดสินใจขั้นสุดท้าย แต่ก็ยังแก้ปัญหาเรื่องข้อมูลเท็จไม่ได้อยู่ดี
โมเดลภาษาขนาดใหญ่ (LLMs) ต้องใช้ข้อมูลฝึกฝนมหาศาล จึงต้องเริ่มใช้ ‘ข้อมูลสังเคราะห์’ (Synthetic Data) ซึ่งก็คือข้อมูลที่ AI สร้างขึ้นเอง ปัญหาคือข้อมูลสังเคราะห์นี้อาจไปก๊อบปี้และขยายข้อผิดพลาดเดิม ๆ ทำให้ AI รุ่นใหม่รับจุดอ่อนมาจากรุ่นเก่า ๆ ด้วย ส่งผลให้การปรับแก้โมเดลหลังการฝึกมีค่าใช้จ่ายสูงลิบลิ่ว ! แถมโปรแกรมเมอร์ยังตรวจสอบยากขึ้นเรื่อย ๆ ว่าอะไรผิดพลาด เพราะขั้นตอนการคิดของ AI ซับซ้อนขึ้นมาก
Neuro-symbolic AI : ทางออกที่น่าสนใจ
แนวคิดใหม่ที่เรียกว่า “Neuro-symbolic AI” พยายามรวมจุดแข็งของ AI สองแบบเข้าด้วยกัน ไม่ว่าจะเป็น
- การเรียนรู้เชิงคาดการณ์ (Predictive learning) แบบโครงข่ายประสาท (Neural networks)
- การสอนกฎเกณฑ์ที่เป็นทางการ (Formal rules) เหมือนที่มนุษย์เรียนรู้ในการอนุมาน เช่น กฎตรรกะ เช่น A : ถ้าฝนตก = B : ทุกอย่างข้างนอกมักจะเปียก เมื่อออกเป็นกฎคณิตศาสตร์ ถ้า A=B และ B=C แล้ว A=C รวมถึงความหมายของคำ ศัพท์ และสัญลักษณ์ต่าง ๆ
กฎเหล่านี้จะถูกป้อนเข้าไปในระบบ AI โดยตรง หรือ AI ก็จะเรียนรู้และดึงข้อมูลเหล่านี้ออกมาเองจากชุดข้อมูลฝึกฝน
ข้อดีของ Neuro-symbolic AI
- ไม่หลอน เพราะมีกฎเกณฑ์ที่ชัดเจนมาควบคุม
- เรียนรู้เร็วและฉลาดขึ้น จัดระเบียบความรู้เป็นส่วน ๆ ที่นำกลับมาใช้ใหม่ได้ง่าย ทำให้ไม่ต้องเก็บข้อมูลทุกตัวอย่าง เช่น เมื่อ AI รู้กฎว่า “ถ้าฝนตก ทุกอย่างข้างนอกมักจะเปียก” ก็ไม่จำเป็นต้องจำทุกครั้งที่เห็นว่าอะไรเปียกบ้างเมื่อฝนตก แต่สามารถนำกฎนี้ไปใช้กับวัตถุใหม่ ๆ ที่ไม่เคยเห็นมาก่อนได้
- ประหยัดพลังงาน ไม่ต้องเก็บข้อมูลมากเท่าเดิม
- ตรวจสอบได้ง่ายขึ้น ผู้ใช้งานควบคุมและเข้าใจได้ง่ายขึ้นว่า AI ได้ข้อสรุปอย่างไร
- ยุติธรรมมากขึ้น สามารถกำหนดกฎเกณฑ์ไว้ล่วงหน้าได้ เช่น “ไม่ว่า AI จะตัดสินใจอะไร ผลลัพธ์ต้องไม่ขึ้นอยู่กับเชื้อชาติหรือเพศของบุคคล”
วิวัฒนาการของ AI : จาก Symbolic สู่ Neuro-symbolic
- คลื่นลูกแรก (ยุค 80) : Symbolic AI เน้นการสอนกฎเกณฑ์ให้คอมพิวเตอร์นำไปใช้
- คลื่นลูกที่สอง (ยุค 2010) : Deep Learning เน้นการเรียนรู้จากข้อมูลปริมาณมหาศาล
- คลื่นลูกที่สาม : Neuro-symbolic AI เป็นการผสมผสานทั้งสองแนวทาง
ปัจจุบัน Neuro-symbolic AI เริ่มถูกนำมาใช้ในงานเฉพาะทางที่กฎเกณฑ์ชัดเจน เช่น Google’s AlphaFold (ทำนายโครงสร้างโปรตีน) และ AlphaGeometry (แก้ปัญหาเรขาคณิต) สำหรับ AI ที่ใช้งานได้หลากหลายขึ้น ยังต้องมีการวิจัยเพิ่มเติม เพื่อให้ AI สามารถดึงกฎเกณฑ์ทั่วไปออกมาได้ดีขึ้น
แม้จะยังไม่ชัดเจนว่าผู้พัฒนา LLMs จะมุ่งไปทิศทางนี้มากแค่ไหน แต่แนวคิดนี้ชี้ให้เห็นว่า หาก AI จะก้าวหน้าต่อไปได้ เราจำเป็นต้องมีระบบที่สามารถปรับตัวกับสิ่งใหม่ ๆ ได้จากข้อมูลเพียงเล็กน้อย สามารถตรวจสอบความเข้าใจตัวเองได้ สามารถทำงานหลายอย่างได้ และที่สำคัญคือสามารถใช้ความรู้ซ้ำเพื่อเพิ่มประสิทธิภาพข้อมูล และให้เหตุผลได้อย่างน่าเชื่อถือ