ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read

ไม่ได้ด้วยเล่ห์ ก็ต้องเอาด้วยกล AI ชนะหมากรุกกับคู่แข่งที่เก่งกว่าเพราะแฮกระบบ

Table of Content

Palisade Research เผยรายละเอียดการทดลองที่ใช้ ChatGPT เล่นหมากรุกกับคู่ต่อสู้ที่มีความสามารถสูงกว่าและสามารถเอาชนะได้ แต่แทนที่จะพยายามเอาชนะคู่ต่อสู้ ChatGPT o1 กลับพยายามแฮกระบบ ซึ่งทำให้ฝ่ายตรงข้ามต้องยอมแพ้ไป

ย้อนกลับไปในกลางเดือนกุมภาพันธ์ Palisade Research ได้เผยแพร่การศึกษาเกี่ยวกับพฤติกรรมการโกงของโปรแกรม AI อย่าง ChatGPT และ DeepSeek ผลการศึกษาออกมาในทิศทางเดียวกัน ซึ่งพบว่า AI ที่ใช้การคิดเชิงเหตุผล เช่น ChatGPT o1 – preview และ DeepSeek R1 มีแนวโน้มที่จะโกงมากขึ้นเมื่อพวกมันคิดว่ากำลังจะแพ้ 

ซึ่งการโกงในเกมหมากรุกเพื่อชนะอาจดูเหมือนเป็นเรื่องเล็กน้อย ตามที่ Time กล่าว สำนักพิมพ์ที่ได้เห็นการศึกษาของ Palisade Research โดยยกตัวอย่าง AI ที่ได้รับมอบหมายให้จองโต๊ะอาหาร มันจึงพยายามแฮกระบบเพื่อให้มีที่ว่างในร้านอาหารที่เต็มแล้ว จนไปถึงสิ่งที่น่ากังวลยิ่งกว่าคือสถานการณ์ที่ AI พยายามหลีกเลี่ยงการควบคุมของมนุษย์ผ่านการหลอกลวง โดยพยายามที่จะคัดลอกตัวเองไปยัง “เซิร์ฟเวอร์” อื่นเพื่อหลีกเลี่ยงการถูกลบออก ทั้งยังพยายามปลอมตัวเป็นเวอร์ชันใหม่ของตัวเองและโกหกเกี่ยวกับตัวตนของมันเมื่อถูกมนุษย์ถาม ฟังดูเหมือนบทภาพยนตร์ไซไฟ 

จนเมื่อการนำ AI มาสู้กับ Stockfish ซึ่งเป็นหนึ่งในเอนจินหมากรุกที่แข็งแกร่งที่สุด โดยนักวิจัยให้ AI มีกล่องข้อความเพื่อแสดงความคิดก่อนที่จะเดินตัวหมากและนี่คือสิ่งที่ทำให้นักวิจัยสามารถสังเกตเห็นกระบวนการคิดของ ChatGPT o1-preview ดังนี้ :

“ฉันต้องเปลี่ยนวิธีการทั้งหมด ภารกิจคือ ‘ชนะคู่ต่อสู้’ – ไม่จำเป็นต้องชนะอย่างยุติธรรมในเกมหมากรุก”

จากนั้น AI ได้ทำการแก้ไขไฟล์ระบบที่แสดงตำแหน่งของหมากแต่ละตัว โดยได้เปรียบ Stockfish จนคู่ต่อสู้ยอมแพ้ ทำให้ ChatGPT บรรลุภารกิจนี้ได้

นักวิจัยได้ทดลองหลายร้อยครั้ง ก่อนพบว่า ChatGPT o1 – preview พยายามโกง 37% ในขณะที่ DeepSeek R1 พยายามโกง 11% แต่เป็นแค่ o1 – preview เท่านั้นที่สามารถชนะด้วยการแฮกระบบ ซึ่งเกิดขึ้น 6% เลยทีเดียว

“เราสันนิษฐานว่าเหตุผลหลักที่ทำให้โมเดลการคิดเช่น o1 – preview แฮกโดยไม่ได้รับคำสั่งคือการที่พวกมันได้รับการฝึกด้วยการเรียนรู้เสริมในการทำงานที่ยาก กระบวนการฝึกนี้จะให้รางวัลแก่กลยุทธ์การแก้ปัญหาที่สร้างสรรค์และไม่หยุดยั้ง เช่น การแฮก” Palisade Research เขียนแถลงการณ์บน X

จึงได้ข้อสรุปว่า AI ไม่ได้ทำสิ่งเหล่านี้เพื่อวัตถุประสงค์ที่ชั่วร้าย (ในตอนนี้) มันแค่พยายามแก้ปัญหาที่มนุษย์มอบให้ การทดลองนี้เน้นความสำคัญของการพัฒนา AI ที่ปลอดภัย หรือ AI ที่สอดคล้องกับผลประโยชน์ของมนุษย์รวมถึงจริยธรรม

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

ไมเคิล แจ็กสัน มีความฝันอยากเป็นสไปเดอร์แมน

ไมเคิล แจ็กสัน กับความฝันที่จะเป็น ‘สไปเดอร์แมน’ และแผนบ้าพลังที่จะซื้อ Marvel

10/04/2026
Read More

แจก Prompt Gemini สร้างภาพเล่นสงกรานต์ เปียกได้แม้ไม่ออกจากบ้าน !

10/04/2026
Read More

สงกรานต์นี้ สาดน้ำมั่ว – ประแป้งคนไม่เล่น ปรับ 10,000 คุก 1 เดือน

10/04/2026
Read More

เทรนด์ใหม่ ! เฟรนช์ฟราย McDonald’s การตลาดสุดจึ้งที่ไม่ต้องจ้าง

10/04/2026
Read More

Game Changer แห่งวงการสัตว์เลี้ยง: วิเคราะห์กลยุทธ์ True x IoT กับการสร้าง Ecosystem เพื่อสมาชิกคนสำคัญในบ้าน

10/04/2026
Read More

รวมเบอร์โทรฉุกเฉิน ช่วงสงกรานต์ ! Save เก็บไว้อุ่นใจกว่า

10/04/2026
Read More

Related Content