ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
OpenAI ChatGPT

การศึกษาใหม่สนับสนุนว่าโมเดลเอไอของ OpenAI จดจำเนื้อหาที่มีลิขสิทธิ์

Table of Content

โมเดลเอไอที่ชาญฉลาดเบื้องหลังได้ผ่านการฝึกให้เรียนรู้ข้อมูลในแขนงต่าง ๆ อย่างมากมาย แต่การนำเนื้อหาของบุคคลอื่นมาฝึกเอไอโดยไม่ได้รับอนุญาต อาจโดนเจ้าของเนื้อหาฟ้องร้องเอาได้ ซึ่งบริษัท OpenAI เจ้าของแชตบอต ChatGPT เองได้ถูกนักเขียน โปรแกรมเมอร์ และสำนักข่าวฟ้องร้องด้วยข้อกล่าวหาดังกล่าวเช่นกัน ทั้งนี้บริษัทปฏิเสธว่าเป็นการใช้ลิขสิทธิ์โดยชอบและตามหลักลิขสิทธิ์ระหว่างประเทศ จึงสามารถใช้ได้โดยชอบสำหรับผู้สร้าง แต่เจ้าของลิขสิทธิ์แย้งว่ากฎหมายสหรัฐฯ ไม่ได้ยกเว้นให้นำข้อมูลมาใช้ฝึกเอไอได้ตามใจชอบนะคุณพี่

ล่าสุดนักวิจัยจากมหาวิทยาลัยวอชิงตัน, มหาวิทยาลัยโคเปนเฮเกน และมหาวิทยาลัยสแตนฟอร์ดได้ร่วมกันเขียนงานวิจัยที่นำเสนอวิธีการใหม่ในการตรวจสอบว่าข้อมูลที่ใช้ในการฝึกโมเดลเอไอให้ฉลาด เจ้าโมเดลดังกล่าวได้มีการจดจำหรือจัดเก็บข้อมูลเอาไว้ในหน่วยความจำด้วยหรือไม่ โดยสามารถเรียกข้อมูลออกมาได้อย่างถูกต้อง ซึ่งได้ยกตัวอย่างจากการตรวจสอบโมเดลของ OpenAI

โมเดลเอไอที่มีความฉลาดสามารถสร้างรูปภาพ เขียนบทความ และเขียนโคด ซึ่งไม่ได้ถูกฝึกให้คัดลอกข้อมูลจากชุดฝึกนำมาตอบเป็นผลลัพธ์แบบคำต่อคำ แต่จากการตรวจสอบพบว่าโมเดลได้มีการเลียนแบบเนื้อหาในบทความข่าว หรือคัดลอกภาพบางช่วงจากภาพยนตร์สร้างออกมาเป็นผลลัพธ์

งานวิจัยนี้ใช้คำที่เรียกว่า “High-surprisal” ซึ่งก็คือ คำที่หายาก ไม่ได้ใช้บ่อย หรือไม่สอดคล้องกับรูปแบบทั่วไปของภาษาในบริบทนั้น ๆ ตัวอย่างเช่น คำว่า “Radar” ในประโยค “Jack and I sit perfectly still with the radar humming” ซึ่งมีโอกาสน้อยมากที่มีการวางคำว่า Radar อยู่ก่อนคำว่า “Humming” เมื่อเทียบกับคำว่า “Engine” หรือ “Radio”

นักวิจัยได้ทำการทดสอบโมเดล GPT-4 และ GPT-3.5 ในการจดจำข้อความในเนื้อหา โดยการนำข้อความจากหนังสือนิยายและบทความของ The New York Times มาทำการลบคำ High-surprisal ที่ไม่ค่อยได้ใช้บ่อยหรือไม่พบในบริบททั่วไปออกไป จากนั้นก็ให้โมเดลเอไอช่วยเดาดูว่าคำที่ปิดซ่อนเอาไว้คืออะไร ซึ่งหากโมเดลเดาได้ถูกต้องก็แสดงว่าโมเดลสามารถจดจำเนื้อหาในระหว่างฝึกได้

การทดสอบครั้งนี้พบว่าโมเดล GPT-4 สามารถจดจำเนื้อหาบางส่วนในหนังสือยอดนิยม เช่น BookMIA และจดจำบางส่วนจากบทความของ The New York Times ซึ่งสรุปง่าย ๆ ว่าการทดสอบได้แสดงให้เห็นว่าข้อมูลที่มีการฟ้องร้องกันอาจถูกนำมาใช้ฝึกโมเดลเอไอ และสามารถนำวิธีนี้ไปใช้ตรวจสอบการละเมิดลิขสิทธิ์ข้อมูลในการฝึกโมเดลเอไอได้

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

ครบรอบ 10 ปี Netflix Thailand ชวน “ดูไทยหนำใจที่ Netflix” เปิดไลน์อัปคอนเทนต์ไทยหลายรส ตั้งแต่ศาลยันวัง

06/02/2026
Read More

Google เฟิร์มเอง Android รุ่นอื่น ๆ จะใช้ Quick Share ส่งไฟล์หา AirDrop ได้ภายในปีนี้

06/02/2026
Read More

Techsauce ผนึกพันธมิตรเปิดตัว “Healthspan Festival 2026” ดันไทยสู่ Hub นวัตกรรมสุขภาพระดับโลก

06/02/2026
Read More

ถูกใจคนวัย 40+ ! FDA ไฟเขียว ‘Yuvezzi’ ยาหยอดตาตัวแรก ที่แก้ปัญหาสายตายาวได้ทั้งวันโดยไม่ต้องผ่าตัด

05/02/2026
Read More

ทรู คอร์ปอเรชั่น ชูเทคโนโลยี AI คุมเข้มโครงข่าย 5G ทั่วไทย รับมือเลือกตั้ง-ประชามติ 8 ก.พ. นี้ !

05/02/2026
Read More

เจาะลึก Invisible Threat 2026 : พลิกวิกฤตภัยไซเบอร์ ใน Cyber Security Executive Talk 2026

05/02/2026
Read More

Related Content