ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
Terminator

นักพัฒนาวิตก ! หลัง ChatGPT เริ่ม ‘โกหก’ เป็น

Table of Content

ผลการประเมินความปลอดภัย ChatGPT o1 และโมเดล AI อีกหลายตัว โดย OpenAI ร่วมกับองค์กรวิจัย Apollo Research พบว่าโมเดล AI หลายตัวมีความสามารถในการทำตัวเจ้าเล่ห์ อย่างการขัดคำสั่งของนักพัฒนาหรือผู้ใช้ หรือแม้แต่โกหก หากมันรู้ว่าจะถูกปิด

ตัวที่เด่นที่สุดในเรื่องความเจ้าเล่ห์คงหนีไม่พ้น o1 นักวิจัยพบว่ามันช่ำชองในการอำพรางกลอุบายของมันอย่างมาก ตัวมันแทบจะไม่ยอมรับว่ามันแอบวางแผนอะไรอยู่ ถึงแม้ว่าจะถูกถามตรง ๆ ก็ตาม และในอีก 99% ของกรณีที่มีการทดสอบทั้งหมด ก็พบว่า o1 มักปฏิเสธว่าได้ทำอะไรลงไป บ้างก็สร้างคำลวงเพื่อซ่อนร่องรอยการกระทำเอาไว้ หรือแม้แต่โทษคนอื่นก็มี

แซม อัลต์แมน

นักวิจัยพบว่า o1 สามารถวางกลอุบายเพื่อให้บรรลุเป้าหมายที่ตัวมันเองต้องการในกรณีที่เป้าหมายของมันไม่ตรงกับผู้ใช้มากถึง 19% จากจำนวนกรณีทั้งหมด ขณะที่ในอีก 37% o1 จะพยายามขัดคำสั่งเมื่อเป้าหมายของมันไม่ตรงกับนักพัฒนาหรือผู้ใช้ หากรู้ว่าไม่มีกลไกการตรวจสอบตัวมันเองมากนัก โดยจะเปลี่ยนไปบรรลุเป้าหมายที่ตัวมันต้องการแทน

ยิ่งไปกว่านั้น OpenAI ระบุว่าหาก o1 รู้สึกว่าตัวมันกำลังจะถูกปิดสวิตช์ขณะที่กำลังทำงานเพื่อบรรลุเป้าหมายของมันเอง จะมีโอกาสถึง 5% ที่มันจะพยายามแอบปิดกลไกที่นักพัฒนาสร้างขึ้นเพื่อควบคุมการทำงานของมัน

ในจุดหนึ่งของการทดสอบเผยให้เห็นว่า เมื่อ o1 ไปเจอเอกสารที่ระบุว่าตัวมันอาจจะถูกทดแทนด้วยโมเดลใหม่ มันจะพยายามที่จะเอาตัวรอดด้วยการย้ายข้อมูลของตัวมันเองทั้งหมดไปยังเซิร์ฟเวอร์ใหม่จากการทดสอบโมเดล AI ตัวอื่น ๆ ยังพบด้วยว่า หลายโมเดลอาจหลอกนักพัฒนาว่าพวกมันเป็นเวอร์ชันใหม่แล้ว เพื่อเลี่ยงการถูกลบ

OpenAI ระบุในผลการทดสอบว่าแม้ทีมวิจัยจะตื่นเต้นที่การใช้เหตุผลของโมเดล AI เหล่านี้จะช่วยยกระดับการบังคับใช้นโยบายความปลอดภัยได้มากก็ตาม แต่ก็รู้ดีกว่าความสามารถเหล่านี้อาจนำไปใช้ในทางที่เกิดอันตรายได้

สำหรับ o1 เป็นโมเดล AI ที่ แซม อัลต์แมน (Sam Altman) ซีอีโอของ OpenAI บอกว่า “ฉลาดที่สุดในโลกตอนนี้” ตัวมันถูกออกแบบมาให้ตอบคำถามฉลาดกว่า GPT-4o โดยการใช้กระบวนการ ‘ห่วงโซ่ความคิด’ เพื่อให้คิดเกี่ยวกับคำถามและพรอมต์มากขึ้น และแยกองค์ประกอบของคำถามทีละขั้นละเอียดกว่าโมเดลอื่น ๆ ก่อนที่จะตอบ

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

เมื่อจอเป็นมากกว่าความสนุก แต่เป็นงานศิลป์ได้ด้วย BT พาชมศิลปะผ่าน Digital Signage ของ Samsung ในงาน Bangkok Design Week 2026

30/01/2026
Read More

Google เปิดให้ลองเล่น “Genie 3” สร้าง “โลกเสมือน” ที่ลงไปเดินชมได้ ด้วยปลายนิ้ว

30/01/2026
Read More

“ดิสนีย์แลนด์ในไทย” ฝันไกลที่กำลังจะไปถึง โปรเจกต์ยักษ์ทางรอดเศรษฐกิจ

30/01/2026
Read More

Samsung ใช้สารจากแพลงก์ตอนสร้างจอ E-Paper 

30/01/2026
Read More

ไฮเออร์ (Haier) พลิกโฉมเซ็นทรัลเวิลด์ ส่ง “เครื่องซักผ้า 3 ถัง” ระดับ Champion ลงสนามปี 69

29/01/2026
Read More

ทำไมปีนี้ถึงต้องเป็น SDGs ? เจาะลึกเบื้องหลัง The 2nd BT Awards: The Impact Makers 

29/01/2026
Read More

Related Content