โปรเจ็ค Google Deep Mind ได้ประสบความสำเร็จในการหาเส้นทางออกจากเขาวงกต 3 มิติ ได้ด้วยตัวโปรแกรมเอง

เมื่อไม่นานมานี้ Deep Mind เคยประสบความสำเร็จในการเล่น Go กับมนุษย์มาก่อนแล้ว มาคราววนี้กับความท้าทายใหม่ “เขาวงกต 3 มิติ” ที่ดูคล้ายกับภาพจากเกม Doom ในปี 1993 โดยวิดีโอด้านล่างนี้แสดงภาพของ AI ที่หาทางออกจากเขาวงกตได้อย่างง่ายดายเพียงแค่ใช้การ “มอง” ไปที่ฉากต่างๆและตัดสินใจว่าจะทำอะไรต่อไป ซึ่งเป็นวิธีเดียวกันกับมนุษย์ที่ใช้ในการตัดสินใจ

Play video

AI ทำงานได้อย่างไร ?

AI หรือที่เรียกว่า Artificial Intelligence (ความฉลาดจำลอง) นั้น ทำงานด้วยวิธีที่เรียกว่า “Reinforcement Learning” (การเสริมแรงบวกต่อการเรียนรู้) ซึ่งโปรแกรมจะมีการให้รางวัลแก่ระบบ AI ถ้าหากสามารถเพิ่ม Score ให้มากขึ้นได้ ซึ่งนำมาผนวกเข้ากับ Deep Naeural Network ที่จะวิเคราะห์และเรียนรู้รูปแบบของฉากภายในเกม โดยจะย้อนข้อมูลที่บันทึกกลับไปยังฉากที่ผ่านมาแล้วและเรียนรู้เปรียบเทียบกับฉากปัจจุบัน ซึ่งเรียกวิธีการนี้ว่า “Experience Replay” (ประสบการณ์แบบย้อนกลับ)

ถึงแม้จะได้ผลออกมาดีเยี่ยม แต่ทางทีมพัฒนาก็ยอมรับว่ายังมีช่องโหว่อยู่ “มันใช้หน่วยความจำมากกว่าและการคำนวนต่อการตอบสองที่มากกว่า” นั่นจึงเป็นที่มาของวิธีที่เรียกว่า Asynchronous Reinforcement learning (การเสริมแรงการเรียนรู้ที่ต่างกันแบบขนาน) ซึ่งจะทำให้เห็นการแก้ปัญหาของ AI ในรูปแบบต่างๆ ต่อปัญหาเดียวกัน และดำเนินการเล่นเกมต่อไปเป็นคู่ขนานจนจบเกม และนำค่าประสบการณ์ที่ได้มาเปรียบเทียบกัน

เกมเขาวงกต 3 มิติ ที่ทำมาทดสอบนี้ เรียกว่า Labyrinth มีลักษณะคล้ายเกม Doom ที่ไม่มีการยิงกัน ตัวระบบจะไดัรับรางวัลจากตัวโปรแกรมเกมในกรณีที่สามารถหา Apple และ Portal (เป็นตัววาร์ปไปยังส่วนอื่นของเขาวงกต) พบ และจะต้องทำ Score ให้ได้มากที่สุดเท่าที่จะเป็นไปได้ ในเวลา 60 วินาที

ทางทีมพัฒนากล่าวว่า “เกมนี้มีความท้าทายเสียยิ่งกว่า เกมขับรถ ที่เคยทำมา เพราะตัว AI จะต้องเผชิญกับปัญหาและฉากใหม่ๆ ในเขาวงกตในทุกๆครั้งที่ทดสอบ และจะต้องเรียนรู้ที่จะวางแผนในการสำรวจเขาวงกตด้วย”

ชมคลิปเกมขับรถได้ด้านล่างนี้

Play video

ที่มา : techinsider และวิดีโอจาก Youtube.com