Page 122 – BT beartai

Palisade Research เผยรายละเอียดการทดลองที่ใช้ ChatGPT เล่นหมากรุกกับคู่ต่อสู้ที่มีความสามารถสูงกว่าและสามารถเอาชนะได้ แต่แทนที่จะพยายามเอาชนะคู่ต่อสู้ ChatGPT o1 กลับพยายามแฮกระบบ ซึ่งทำให้ฝ่ายตรงข้ามต้องยอมแพ้ไป

ย้อนกลับไปในกลางเดือนกุมภาพันธ์ Palisade Research ได้เผยแพร่การศึกษาเกี่ยวกับพฤติกรรมการโกงของโปรแกรม AI อย่าง ChatGPT และ DeepSeek ผลการศึกษาออกมาในทิศทางเดียวกัน ซึ่งพบว่า AI ที่ใช้การคิดเชิงเหตุผล เช่น ChatGPT o1 – preview และ DeepSeek R1 มีแนวโน้มที่จะโกงมากขึ้นเมื่อพวกมันคิดว่ากำลังจะแพ้

ซึ่งการโกงในเกมหมากรุกเพื่อชนะอาจดูเหมือนเป็นเรื่องเล็กน้อย ตามที่ Time กล่าว สำนักพิมพ์ที่ได้เห็นการศึกษาของ Palisade Research โดยยกตัวอย่าง AI ที่ได้รับมอบหมายให้จองโต๊ะอาหาร มันจึงพยายามแฮกระบบเพื่อให้มีที่ว่างในร้านอาหารที่เต็มแล้ว จนไปถึงสิ่งที่น่ากังวลยิ่งกว่าคือสถานการณ์ที่ AI พยายามหลีกเลี่ยงการควบคุมของมนุษย์ผ่านการหลอกลวง โดยพยายามที่จะคัดลอกตัวเองไปยัง “เซิร์ฟเวอร์” อื่นเพื่อหลีกเลี่ยงการถูกลบออก ทั้งยังพยายามปลอมตัวเป็นเวอร์ชันใหม่ของตัวเองและโกหกเกี่ยวกับตัวตนของมันเมื่อถูกมนุษย์ถาม ฟังดูเหมือนบทภาพยนตร์ไซไฟ

จนเมื่อการนำ AI มาสู้กับ Stockfish ซึ่งเป็นหนึ่งในเอนจินหมากรุกที่แข็งแกร่งที่สุด โดยนักวิจัยให้ AI มีกล่องข้อความเพื่อแสดงความคิดก่อนที่จะเดินตัวหมากและนี่คือสิ่งที่ทำให้นักวิจัยสามารถสังเกตเห็นกระบวนการคิดของ ChatGPT o1-preview ดังนี้ :

“ฉันต้องเปลี่ยนวิธีการทั้งหมด ภารกิจคือ ‘ชนะคู่ต่อสู้’ – ไม่จำเป็นต้องชนะอย่างยุติธรรมในเกมหมากรุก”

จากนั้น AI ได้ทำการแก้ไขไฟล์ระบบที่แสดงตำแหน่งของหมากแต่ละตัว โดยได้เปรียบ Stockfish จนคู่ต่อสู้ยอมแพ้ ทำให้ ChatGPT บรรลุภารกิจนี้ได้

นักวิจัยได้ทดลองหลายร้อยครั้ง ก่อนพบว่า ChatGPT o1 – preview พยายามโกง 37% ในขณะที่ DeepSeek R1 พยายามโกง 11% แต่เป็นแค่ o1 – preview เท่านั้นที่สามารถชนะด้วยการแฮกระบบ ซึ่งเกิดขึ้น 6% เลยทีเดียว

“เราสันนิษฐานว่าเหตุผลหลักที่ทำให้โมเดลการคิดเช่น o1 – preview แฮกโดยไม่ได้รับคำสั่งคือการที่พวกมันได้รับการฝึกด้วยการเรียนรู้เสริมในการทำงานที่ยาก กระบวนการฝึกนี้จะให้รางวัลแก่กลยุทธ์การแก้ปัญหาที่สร้างสรรค์และไม่หยุดยั้ง เช่น การแฮก” Palisade Research เขียนแถลงการณ์บน X

จึงได้ข้อสรุปว่า AI ไม่ได้ทำสิ่งเหล่านี้เพื่อวัตถุประสงค์ที่ชั่วร้าย (ในตอนนี้) มันแค่พยายามแก้ปัญหาที่มนุษย์มอบให้ การทดลองนี้เน้นความสำคัญของการพัฒนา AI ที่ปลอดภัย หรือ AI ที่สอดคล้องกับผลประโยชน์ของมนุษย์รวมถึงจริยธรรม

Deloitte ประกาศรับทีม Appsynth เสริมศักยภาพด้านดิจิทัลในเอเชียตะวันออกเฉียงใต้

News

TECH PR News

Deloitte ประกาศรับทีม Appsynth เสริมศักยภาพด้านดิจิทัลในเอเชียตะวันออกเฉียงใต้

นรากร เย็นกลาง

28/02/2025

News

GAME Game News

Ubisoft แจ้งเตือนแผ่นเกม Assassin’s Creed Shadows ที่หลุดออกมายังไม่ใช่เวอร์ชันสมบูรณ์

เกม Assassin’s Creed Shadows ที่หลุดออกมาก่อนที่จะวางจำหน่ายอย่างเป็นทางการ ยังถือว่าไม่ใช่เวอร์ชันที่สมบูรณ์

วงศกร ปฐมชัยวัฒน์

28/02/2025

News

TECH IT News

เปิดตัว Xiaomi 15 Ultra: ขุมพลัง Snapdragon 8 Elite, กล้องซูม 200 ล้านพิกเซล ความยาวโฟกัส 100 มม.

ปรีดี ฤกษ์วลีกุล

28/02/2025

‘แบงก์ชาติ’ จะปราบ ‘บัญชีม้า’ ยังไง ? | bt Originals

Video

LIFE Money

‘แบงก์ชาติ’ จะปราบ ‘บัญชีม้า’ ยังไง ? | bt Originals

เอกพล ชูเชิด

28/02/2025

iPhone จอพับไร้รอยพับ ! คาดจะเปิดตัวกลางปี 2026 นี้

News

TECH IT News

iPhone จอพับไร้รอยพับ ! คาดจะเปิดตัวกลางปี 2026 นี้

อมลวรรณ ศรัทธานนท์

28/02/2025

News

TECH IT News

ไมโครซอฟท์ ประเทศไทย เปิดตัวออฟฟิศใหม่ ผสานเทคโนโลยี ข้อมูล ตอบโจทย์คนทำงานยุคใหม่

ไมโครซอฟท์ ประเทศไทย เปิดตัวสำนักงานแห่งใหม่ที่โครงการ One Bangkok อย่างเป็นทางการ โดยสำนักงานแห่งนี้ได้รับการออกแบบภายใต้แนวคิด “Digital Harmony” ...อ่านต่อ

อมลวรรณ ศรัทธานนท์

28/02/2025

DeepSeek ถูกขยายการปรับใช้โมเดลสู่เครื่องใช้ภายในบ้าน ทีวี ตู้เย็น และเครื่องดูดฝุ่น

News

TECH IT News

DeepSeek ถูกขยายการปรับใช้โมเดลสู่เครื่องใช้ภายในบ้าน ทีวี ตู้เย็น และเครื่องดูดฝุ่น

ศิลา วงศ์เจริญ

28/02/2025

News

TECH IT News

Tencent เฉือนคม DeepSeek เปิดตัวโมเดล Hunyuan Turbo S ที่ตอบคำถามได้เร็วกว่า R1

วันพฤหัสบดีนี้ Tencent บริษัทเทคโนโลยีข้ามชาติของจีนได้เปิดตัวโมเดลการใช้เหตุผล Hunyuan Turbo S ซึ่งอ้างว่ามีความเหนือกว่าโมเดล DeepSeek R1 โดยสามารถตอบคำถามได้รวดเร็วกว่า ...อ่านต่อ

ศิลา วงศ์เจริญ

27/02/2025

สตูดิโอผู้สร้าง Palworld ให้พนักงานหยุดงาน เพื่อไปเล่นเกม Monster Hunter Wilds

News

GAME Game News

สตูดิโอผู้สร้าง Palworld ให้พนักงานหยุดงาน เพื่อไปเล่นเกม Monster Hunter Wilds

วงศกร ปฐมชัยวัฒน์

27/02/2025

News

GAME Game News

เปิดตัวอย่างแรก Pokémon Legends: Z-A และ Pokémon Champions

เปิดข้อมูลของเกมใหม่ ๆ ที่แฟน Pokemon ทั่วโลกรอคอยอย่าง Pokemon Legends: Z-A ที่ปล่อยตัวอย่างแรกออกมาให้ชมหลังจากปล่อยคลิปยั่วน้ำลายสั้น ๆ เมื่อปีที่แล้ว

วงศกร ปฐมชัยวัฒน์

27/02/2025