Read

นักพัฒนาวิตก ! หลัง ChatGPT เริ่ม ‘โกหก’ เป็น

จตุรวิทย์ เครือวาณิชกิจ | 14/12/2024

Table of Content

ผลการประเมินความปลอดภัย ChatGPT o1 และโมเดล AI อีกหลายตัว โดย OpenAI ร่วมกับองค์กรวิจัย Apollo Research พบว่าโมเดล AI หลายตัวมีความสามารถในการทำตัวเจ้าเล่ห์ อย่างการขัดคำสั่งของนักพัฒนาหรือผู้ใช้ หรือแม้แต่โกหก หากมันรู้ว่าจะถูกปิด

ตัวที่เด่นที่สุดในเรื่องความเจ้าเล่ห์คงหนีไม่พ้น o1 นักวิจัยพบว่ามันช่ำชองในการอำพรางกลอุบายของมันอย่างมาก ตัวมันแทบจะไม่ยอมรับว่ามันแอบวางแผนอะไรอยู่ ถึงแม้ว่าจะถูกถามตรง ๆ ก็ตาม และในอีก 99% ของกรณีที่มีการทดสอบทั้งหมด ก็พบว่า o1 มักปฏิเสธว่าได้ทำอะไรลงไป บ้างก็สร้างคำลวงเพื่อซ่อนร่องรอยการกระทำเอาไว้ หรือแม้แต่โทษคนอื่นก็มี

นักวิจัยพบว่า o1 สามารถวางกลอุบายเพื่อให้บรรลุเป้าหมายที่ตัวมันเองต้องการในกรณีที่เป้าหมายของมันไม่ตรงกับผู้ใช้มากถึง 19% จากจำนวนกรณีทั้งหมด ขณะที่ในอีก 37% o1 จะพยายามขัดคำสั่งเมื่อเป้าหมายของมันไม่ตรงกับนักพัฒนาหรือผู้ใช้ หากรู้ว่าไม่มีกลไกการตรวจสอบตัวมันเองมากนัก โดยจะเปลี่ยนไปบรรลุเป้าหมายที่ตัวมันต้องการแทน

ยิ่งไปกว่านั้น OpenAI ระบุว่าหาก o1 รู้สึกว่าตัวมันกำลังจะถูกปิดสวิตช์ขณะที่กำลังทำงานเพื่อบรรลุเป้าหมายของมันเอง จะมีโอกาสถึง 5% ที่มันจะพยายามแอบปิดกลไกที่นักพัฒนาสร้างขึ้นเพื่อควบคุมการทำงานของมัน

ในจุดหนึ่งของการทดสอบเผยให้เห็นว่า เมื่อ o1 ไปเจอเอกสารที่ระบุว่าตัวมันอาจจะถูกทดแทนด้วยโมเดลใหม่ มันจะพยายามที่จะเอาตัวรอดด้วยการย้ายข้อมูลของตัวมันเองทั้งหมดไปยังเซิร์ฟเวอร์ใหม่จากการทดสอบโมเดล AI ตัวอื่น ๆ ยังพบด้วยว่า หลายโมเดลอาจหลอกนักพัฒนาว่าพวกมันเป็นเวอร์ชันใหม่แล้ว เพื่อเลี่ยงการถูกลบ

OpenAI ระบุในผลการทดสอบว่าแม้ทีมวิจัยจะตื่นเต้นที่การใช้เหตุผลของโมเดล AI เหล่านี้จะช่วยยกระดับการบังคับใช้นโยบายความปลอดภัยได้มากก็ตาม แต่ก็รู้ดีกว่าความสามารถเหล่านี้อาจนำไปใช้ในทางที่เกิดอันตรายได้

สำหรับ o1 เป็นโมเดล AI ที่ แซม อัลต์แมน (Sam Altman) ซีอีโอของ OpenAI บอกว่า “ฉลาดที่สุดในโลกตอนนี้” ตัวมันถูกออกแบบมาให้ตอบคำถามฉลาดกว่า GPT-4o โดยการใช้กระบวนการ ‘ห่วงโซ่ความคิด’ เพื่อให้คิดเกี่ยวกับคำถามและพรอมต์มากขึ้น และแยกองค์ประกอบของคำถามทีละขั้นละเอียดกว่าโมเดลอื่น ๆ ก่อนที่จะตอบ

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

15/03/2026

รู้หรือไม่ ? ‘Canon’ แบรนด์กล้องระดับโลก มีที่มาจากชื่อเจ้าแม่กวนอิม

15/03/2026

เตรียมตัวก้าวสู่จักรวาลซูเปอร์สตาร์ ! เผยรางวัล True AF 2026 ที่จะ “พลิกชีวิต” คุณไปตลอดกาล

14/03/2026

The 2nd BT Awards: The Impact Makers กลับมาอีกครั้งกับงานประกาศรางวัลแด่ผู้สร้างการเปลี่ยนแปลงเพื่อความยั่งยืน

13/03/2026

Meta แท็กทีมตำรวจไทย ทลายเครือข่ายมิจฉาชีพข้ามชาติ ปิดบัญชีผีกว่า 1.5 แสนราย พร้อมเปิดตัว 3 ฟีเจอร์ใหม่สกัดกลโกง

13/03/2026

กลับมาอย่างยิ่งใหญ่ ! เวทีรางวัลของ ‘คนทำจริง’ สร้าง ‘Impact’ ได้จริง The 2nd BT Awards: The Impact Makers

13/03/2026

Audio Pro Business Connected 2026 : อัปเกรดประสบการณ์ลูกค้าด้วยระบบเสียงระดับพรีเมียม

13/03/2026

นักพัฒนาวิตก ! หลัง ChatGPT เริ่ม ‘โกหก’ เป็น

Highlight

รู้หรือไม่ ? ‘Canon’ แบรนด์กล้องระดับโลก มีที่มาจากชื่อเจ้าแม่กวนอิม

เตรียมตัวก้าวสู่จักรวาลซูเปอร์สตาร์ ! เผยรางวัล True AF 2026 ที่จะ “พลิกชีวิต” คุณไปตลอดกาล

The 2nd BT Awards: The Impact Makers กลับมาอีกครั้งกับงานประกาศรางวัลแด่ผู้สร้างการเปลี่ยนแปลงเพื่อความยั่งยืน

รู้หรือไม่ ? ‘Canon’ แบรนด์กล้องระดับโลก มีที่มาจากชื่อเจ้าแม่กวนอิม

เตรียมตัวก้าวสู่จักรวาลซูเปอร์สตาร์ ! เผยรางวัล True AF 2026 ที่จะ “พลิกชีวิต” คุณไปตลอดกาล

The 2nd BT Awards: The Impact Makers กลับมาอีกครั้งกับงานประกาศรางวัลแด่ผู้สร้างการเปลี่ยนแปลงเพื่อความยั่งยืน

กลับมาอย่างยิ่งใหญ่ ! เวทีรางวัลของ ‘คนทำจริง’ สร้าง ‘Impact’ ได้จริง The 2nd BT Awards: The Impact Makers

Audio Pro Business Connected 2026 : อัปเกรดประสบการณ์ลูกค้าด้วยระบบเสียงระดับพรีเมียม

Related Content

Google เปิดให้ลองเล่น “Genie 3” สร้าง “โลกเสมือน” ที่ลงไปเดินชมได้ ด้วยปลายนิ้ว

จ่ายแยกทำไม ? ‘True AI Hub’ ทางออกธุรกิจยุคใหม่ รวม 50+ โมเดล AI ระดับโลกไว้ในที่เดียว

พาส่อง Mega Trends ที่น่าจับตาในปี 2026

เตรียมปิดตำนานอีเมล ‘lnwza555’ ‘naruk’ ‘007’ Google เตรียมเปิดฟีเจอร์ให้เราเปลี่ยนชื่อ Gmail เดิมได้ !

BT beartai รีวิวมือถือเรือธงรุ่นอะไรไปบ้างในปี 2025

เมื่อ AI จับเพลงฮิตมา ‘รีมิกซ์’ ใหม่ เจาะลึกเทรนด์ดนตรีข้ามสายพันธุ์ที่กำลังยึดครองหน้าฟีด TikTok