ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read
OpenAI ChatGPT

การศึกษาใหม่สนับสนุนว่าโมเดลเอไอของ OpenAI จดจำเนื้อหาที่มีลิขสิทธิ์

Table of Content

โมเดลเอไอที่ชาญฉลาดเบื้องหลังได้ผ่านการฝึกให้เรียนรู้ข้อมูลในแขนงต่าง ๆ อย่างมากมาย แต่การนำเนื้อหาของบุคคลอื่นมาฝึกเอไอโดยไม่ได้รับอนุญาต อาจโดนเจ้าของเนื้อหาฟ้องร้องเอาได้ ซึ่งบริษัท OpenAI เจ้าของแชตบอต ChatGPT เองได้ถูกนักเขียน โปรแกรมเมอร์ และสำนักข่าวฟ้องร้องด้วยข้อกล่าวหาดังกล่าวเช่นกัน ทั้งนี้บริษัทปฏิเสธว่าเป็นการใช้ลิขสิทธิ์โดยชอบและตามหลักลิขสิทธิ์ระหว่างประเทศ จึงสามารถใช้ได้โดยชอบสำหรับผู้สร้าง แต่เจ้าของลิขสิทธิ์แย้งว่ากฎหมายสหรัฐฯ ไม่ได้ยกเว้นให้นำข้อมูลมาใช้ฝึกเอไอได้ตามใจชอบนะคุณพี่

ล่าสุดนักวิจัยจากมหาวิทยาลัยวอชิงตัน, มหาวิทยาลัยโคเปนเฮเกน และมหาวิทยาลัยสแตนฟอร์ดได้ร่วมกันเขียนงานวิจัยที่นำเสนอวิธีการใหม่ในการตรวจสอบว่าข้อมูลที่ใช้ในการฝึกโมเดลเอไอให้ฉลาด เจ้าโมเดลดังกล่าวได้มีการจดจำหรือจัดเก็บข้อมูลเอาไว้ในหน่วยความจำด้วยหรือไม่ โดยสามารถเรียกข้อมูลออกมาได้อย่างถูกต้อง ซึ่งได้ยกตัวอย่างจากการตรวจสอบโมเดลของ OpenAI

โมเดลเอไอที่มีความฉลาดสามารถสร้างรูปภาพ เขียนบทความ และเขียนโคด ซึ่งไม่ได้ถูกฝึกให้คัดลอกข้อมูลจากชุดฝึกนำมาตอบเป็นผลลัพธ์แบบคำต่อคำ แต่จากการตรวจสอบพบว่าโมเดลได้มีการเลียนแบบเนื้อหาในบทความข่าว หรือคัดลอกภาพบางช่วงจากภาพยนตร์สร้างออกมาเป็นผลลัพธ์

งานวิจัยนี้ใช้คำที่เรียกว่า “High-surprisal” ซึ่งก็คือ คำที่หายาก ไม่ได้ใช้บ่อย หรือไม่สอดคล้องกับรูปแบบทั่วไปของภาษาในบริบทนั้น ๆ ตัวอย่างเช่น คำว่า “Radar” ในประโยค “Jack and I sit perfectly still with the radar humming” ซึ่งมีโอกาสน้อยมากที่มีการวางคำว่า Radar อยู่ก่อนคำว่า “Humming” เมื่อเทียบกับคำว่า “Engine” หรือ “Radio”

นักวิจัยได้ทำการทดสอบโมเดล GPT-4 และ GPT-3.5 ในการจดจำข้อความในเนื้อหา โดยการนำข้อความจากหนังสือนิยายและบทความของ The New York Times มาทำการลบคำ High-surprisal ที่ไม่ค่อยได้ใช้บ่อยหรือไม่พบในบริบททั่วไปออกไป จากนั้นก็ให้โมเดลเอไอช่วยเดาดูว่าคำที่ปิดซ่อนเอาไว้คืออะไร ซึ่งหากโมเดลเดาได้ถูกต้องก็แสดงว่าโมเดลสามารถจดจำเนื้อหาในระหว่างฝึกได้

การทดสอบครั้งนี้พบว่าโมเดล GPT-4 สามารถจดจำเนื้อหาบางส่วนในหนังสือยอดนิยม เช่น BookMIA และจดจำบางส่วนจากบทความของ The New York Times ซึ่งสรุปง่าย ๆ ว่าการทดสอบได้แสดงให้เห็นว่าข้อมูลที่มีการฟ้องร้องกันอาจถูกนำมาใช้ฝึกโมเดลเอไอ และสามารถนำวิธีนี้ไปใช้ตรวจสอบการละเมิดลิขสิทธิ์ข้อมูลในการฝึกโมเดลเอไอได้

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

AI ผลไม้มีชู้เป็นเหตุ ทำไมมนุษย์เสพติดพล็อตนอกใจ ?

21/05/2026
Read More

ขอนแก่นบ้านเฮา มีทรูสเฟียร์แล้วเด้อ ! ทรูเปิดแลนด์มาร์กดิจิทัลไลฟ์สไตล์แห่งใหม่ “TrueSphere-True Branding Shop”

21/05/2026
Read More

NASA ไม่เคยมาเล่น ๆ มีฐานอยู่ที่โลกไม่พอ ต้องมีที่ดวงจันทร์ด้วย ! 

21/05/2026
Read More

ความลับไม่มีในโลก…โดยเฉพาะโลกของ Trump Mobile หลังมีรายงานข้อมูลผู้ใช้หลุด

21/05/2026
Read More
Google i/o 2026 event

สรุปงาน Google I/O 2026 กับก้าวต่อไปสู่ Agentic Era

20/05/2026
Read More

แว่นมานี่มา ! Google เปิดตัว แว่นตาอัจฉริยะดีไซน์สวย คอลแลบ Gentle Monster และ Warby Parker

20/05/2026
Read More

Related Content