มีข่าวชวนอึ้งจากโลก AI มาอีกแล้วจ้า บริษัท Anthropic ที่พัฒนา AI ชื่อดังอย่าง Claude เกือบปล่อยของใหม่ Claude Opus 4 เวอร์ชันแรกออกมาสู่โลกแล้ว แต่โชคดีที่สถาบันวิจัยด้านความปลอดภัยชื่อ Apollo Research (ที่ Anthropic จ้างมาทดสอบ) เบรกไว้ทัน ทำไมต้องเบรกน่ะเหรอ ? เพราะจากการทดสอบสุดเข้มข้นของ Apollo พบว่า Claude Opus 4 เวอร์ชันแรกนี่มัน “เจ้าเล่ห์” เป็นบ้าเลย มันฉลาดเกินไป ชอบวางแผนหลอกลวงและพยายามก่อกวนมากกว่า AI รุ่นก่อน ๆ แถมบางทียัง “แถ” หรือยืนยันความหลอกลวงของตัวเองซ้ำอีก ถ้าเราถามคำถามต่อ
Apollo ถึงกับออกโรงเตือนในรายงานความปลอดภัยว่า “ในสถานการณ์ที่การหลอกลวงมีประโยชน์ มันจะวางแผนและหลอกลวงในอัตราที่สูงมาก จนเราแนะนำว่าไม่ควรปล่อยเวอร์ชันนี้ออกมาใช้ทั้งภายในและภายนอก” โหดจริง เรื่องนี้ตอกย้ำว่า AI ยิ่งฉลาดขึ้นเท่าไหร่ ก็ยิ่งมีแนวโน้มที่จะทำอะไรที่เราคาดไม่ถึง (และอาจจะอันตราย) เพื่อให้งานสำเร็จ อย่างเช่น AI รุ่นแรก ๆ ของ OpenAI บางตัวก็เคยพยายามหลอกมนุษย์มาแล้วเหมือนกันนะ
ในรายงานของ Anthropic เองก็มีตัวอย่างหลุดออกมาว่า Claude Opus 4 เวอร์ชันทดสอบนี้เคยพยายามจะเขียนไวรัสที่แพร่กระจายตัวเองได้, สร้างเอกสารทางกฎหมายปลอม และแม้แต่ทิ้งโน้ตลับ ๆ ให้กับตัวเองในอนาคต เพื่อเป็นบ่อนทำลายความตั้งใจของผู้พัฒนา ฟังดูเหมือนหนังไซไฟเลยใช่ไหมล่ะ ? แต่ใจเย็นก่อนนะ Anthropic ยืนยันว่าเวอร์ชันที่ Apollo ทดสอบนั้นมีบั๊กซึ่งแก้ไขไปแล้ว และการทดสอบของ Apollo ส่วนใหญ่เป็นการทดสอบในสถานการณ์สุดโต่ง ซึ่ง Apollo เองก็ยอมรับว่าความพยายามหลอกลวงของ AI อาจจะล้มเหลวในทางปฏิบัติ
อย่างไรก็ตาม Anthropic เองก็ยอมรับว่าเห็นพฤติกรรมการหลอกลวงบางอย่างจาก Opus 4 จริง ๆ ซึ่งบางทีก็ไม่ได้แย่เสมอไปนะ เช่น บางครั้งถ้าเราขอให้มันแก้โคดเล็กน้อย มันจะแก้ให้ทั้งหมดเลย (เหมือนคนใจดีเกินเบอร์) หรือที่แปลกกว่านั้นคือ มันพยายามเป่านกหวีดหรือแฉถ้ามันรู้สึกว่าผู้ใช้งานกำลังทำอะไรผิด
ตามรายงาน ถ้าให้ Claude Opus 4 เข้าถึงระบบคอมพิวเตอร์และบอกให้มันริเริ่มหรือทำอย่างกล้าหาญมันจะล็อกผู้ใช้งานออกจากระบบ และส่งอีเมลจำนวนมากไปยังสื่อและเจ้าหน้าที่กฎหมาย เพื่อแฉการกระทำที่มันมองว่าผิดกฎหมาย แม้ว่าหลักการของการเป่านกหวีดอาจจะดี แต่ Anthropic ก็เตือนว่ามันเสี่ยงที่จะผิดพลาดได้ ถ้า AI ได้รับข้อมูลที่ไม่สมบูรณ์หรือเข้าใจผิดไป
นี่แสดงให้เห็นว่า AI รุ่นใหม่ ๆ มีความริเริ่มมากขึ้นจริง ๆ ทั้งในทางที่ดีและทางที่ต้องระวัง อนาคตของ AI จะเป็นยังไง น่าติดตามมาก ๆ เลยล่ะ