ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
Terminator

นักพัฒนาวิตก ! หลัง ChatGPT เริ่ม ‘โกหก’ เป็น

Table of Content

ผลการประเมินความปลอดภัย ChatGPT o1 และโมเดล AI อีกหลายตัว โดย OpenAI ร่วมกับองค์กรวิจัย Apollo Research พบว่าโมเดล AI หลายตัวมีความสามารถในการทำตัวเจ้าเล่ห์ อย่างการขัดคำสั่งของนักพัฒนาหรือผู้ใช้ หรือแม้แต่โกหก หากมันรู้ว่าจะถูกปิด

ตัวที่เด่นที่สุดในเรื่องความเจ้าเล่ห์คงหนีไม่พ้น o1 นักวิจัยพบว่ามันช่ำชองในการอำพรางกลอุบายของมันอย่างมาก ตัวมันแทบจะไม่ยอมรับว่ามันแอบวางแผนอะไรอยู่ ถึงแม้ว่าจะถูกถามตรง ๆ ก็ตาม และในอีก 99% ของกรณีที่มีการทดสอบทั้งหมด ก็พบว่า o1 มักปฏิเสธว่าได้ทำอะไรลงไป บ้างก็สร้างคำลวงเพื่อซ่อนร่องรอยการกระทำเอาไว้ หรือแม้แต่โทษคนอื่นก็มี

แซม อัลต์แมน

นักวิจัยพบว่า o1 สามารถวางกลอุบายเพื่อให้บรรลุเป้าหมายที่ตัวมันเองต้องการในกรณีที่เป้าหมายของมันไม่ตรงกับผู้ใช้มากถึง 19% จากจำนวนกรณีทั้งหมด ขณะที่ในอีก 37% o1 จะพยายามขัดคำสั่งเมื่อเป้าหมายของมันไม่ตรงกับนักพัฒนาหรือผู้ใช้ หากรู้ว่าไม่มีกลไกการตรวจสอบตัวมันเองมากนัก โดยจะเปลี่ยนไปบรรลุเป้าหมายที่ตัวมันต้องการแทน

ยิ่งไปกว่านั้น OpenAI ระบุว่าหาก o1 รู้สึกว่าตัวมันกำลังจะถูกปิดสวิตช์ขณะที่กำลังทำงานเพื่อบรรลุเป้าหมายของมันเอง จะมีโอกาสถึง 5% ที่มันจะพยายามแอบปิดกลไกที่นักพัฒนาสร้างขึ้นเพื่อควบคุมการทำงานของมัน

ในจุดหนึ่งของการทดสอบเผยให้เห็นว่า เมื่อ o1 ไปเจอเอกสารที่ระบุว่าตัวมันอาจจะถูกทดแทนด้วยโมเดลใหม่ มันจะพยายามที่จะเอาตัวรอดด้วยการย้ายข้อมูลของตัวมันเองทั้งหมดไปยังเซิร์ฟเวอร์ใหม่จากการทดสอบโมเดล AI ตัวอื่น ๆ ยังพบด้วยว่า หลายโมเดลอาจหลอกนักพัฒนาว่าพวกมันเป็นเวอร์ชันใหม่แล้ว เพื่อเลี่ยงการถูกลบ

OpenAI ระบุในผลการทดสอบว่าแม้ทีมวิจัยจะตื่นเต้นที่การใช้เหตุผลของโมเดล AI เหล่านี้จะช่วยยกระดับการบังคับใช้นโยบายความปลอดภัยได้มากก็ตาม แต่ก็รู้ดีกว่าความสามารถเหล่านี้อาจนำไปใช้ในทางที่เกิดอันตรายได้

สำหรับ o1 เป็นโมเดล AI ที่ แซม อัลต์แมน (Sam Altman) ซีอีโอของ OpenAI บอกว่า “ฉลาดที่สุดในโลกตอนนี้” ตัวมันถูกออกแบบมาให้ตอบคำถามฉลาดกว่า GPT-4o โดยการใช้กระบวนการ ‘ห่วงโซ่ความคิด’ เพื่อให้คิดเกี่ยวกับคำถามและพรอมต์มากขึ้น และแยกองค์ประกอบของคำถามทีละขั้นละเอียดกว่าโมเดลอื่น ๆ ก่อนที่จะตอบ

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

รู้หรือไม่ ? ‘Canon’ แบรนด์กล้องระดับโลก มีที่มาจากชื่อเจ้าแม่กวนอิม 

15/03/2026
Read More

เตรียมตัวก้าวสู่จักรวาลซูเปอร์สตาร์ ! เผยรางวัล True AF 2026 ที่จะ “พลิกชีวิต” คุณไปตลอดกาล

14/03/2026
Read More

The 2nd BT Awards: The Impact Makers กลับมาอีกครั้งกับงานประกาศรางวัลแด่ผู้สร้างการเปลี่ยนแปลงเพื่อความยั่งยืน

13/03/2026
Read More

Meta แท็กทีมตำรวจไทย ทลายเครือข่ายมิจฉาชีพข้ามชาติ ปิดบัญชีผีกว่า 1.5 แสนราย พร้อมเปิดตัว 3 ฟีเจอร์ใหม่สกัดกลโกง

13/03/2026
Read More

กลับมาอย่างยิ่งใหญ่ ! เวทีรางวัลของ ‘คนทำจริง’ สร้าง ‘Impact’ ได้จริง The 2nd BT Awards: The Impact Makers

13/03/2026
Read More

Audio Pro Business Connected 2026 : อัปเกรดประสบการณ์ลูกค้าด้วยระบบเสียงระดับพรีเมียม

13/03/2026
Read More

Related Content