เจาะลึก !! “Jukebox” AI ที่แต่งเพลงได้ เขียนเนื้อเพลงได้ และร้องเพลงได้แบบเอลวิส เพรสลีย์ แฟรงก์ ซินาตรา เอลลา ฟิตซ์เจอรัลด์ หรือว่า คานเย เวสต์ !!

OpenAI ห้องปฏิบัติการวิจัยปัญญาประดิษฐ์ ที่ตั้งอยู่ในซานฟรานซิสโกรัฐแคลิฟอร์เนีย อันมีพันธกิจเพื่อสร้างสรรค์ปัญญาประดิษฐ์ให้เป็นประโยชน์ต่อมนุษยชาติ ได้เปิดตัวโมเดล AI ระบบใหม่ที่สามารถแต่งเพลงเองได้ชื่อว่า “Jukebox” ระบบเครือข่ายประสาทเทียมที่สามารถสร้างเสียงดนตรี จำลองเสียงร้องของศิลปินในหลายแนวเพลงและตามสไตล์ของศิลปินดังทั้งหลาย ซึ่งมันเป็นเทคโนโลยีที่น่าตื่นตาตื่นใจและน่าประทับใจมาก แม้ว่าผลลัพธ์ของมันอาจจะฟังดูเหมือนเพลงเวอร์ชันเดโมที่คุณภาพอาจยังไม่สมบูรณ์นักก็ตาม

วิธีที่ OpenAI ทำนั้นเป็นสิ่งที่น่าสนใจมาก นักวิจัยใช้เสียงดิบ (raw audio) ในการให้โมเดลนี้ใช้ในการเรียนรู้ เพื่อที่เวลาสร้างผลลัพธ์ออกมามันจะได้สามารถส่งออกเป็นเสียงดิบได้เช่นเดียวกัน ซึ่งแตกต่างจากการใช้ “สัญลักษณ์ทางดนตรี” เช่น พวกโน้ตเพลง เพราะสัญลักษณ์เหล่านั้นไม่ได้มีเสียงรวมอยู่ด้วย เพื่อให้ได้ผลลัพธ์ดังตั้งใจ กลุ่มนักวิจัยจึงสร้างเครือข่ายระบบประสาทเทียมเพื่อใช้ในการเข้ารหัสและบีบอัดเสียงดิบเหล่านั้นแล้วใช้สิ่งที่พวกเขาเรียกว่าหม้อแปลงเพื่อแปลงเสียงที่ถูกบีบอัดใหม่ซึ่งจะทำให้มันส่งออกกลับมาเป็นเสียงดิบเหมือนเดิมดังแผนภูมิด้านล่างนี้

วิธีการนี้คล้ายกับวิธีที่ OpenAI พัฒนาระบบ AI ที่ทำเพลงได้ก่อนหน้านี้ที่เรียกว่า MuseNet แต่ Jukebox ก้าวไปอีกขั้นด้วยการสร้างเนื้อเพลงของตัวเองขึ้นมาจากความร่วมมือ (พวกเขาใช้คำว่า “ร่วมกันเขียน”) กับนักวิจัย OpenAI ต่างจาก MuseNet ซึ่งใช้ข้อมูล MIDI โมเดลเหล่านี้ได้รับการฝึกฝนบนชุดข้อมูลดิบ 1.2 ล้านเพลง (600,000 เพลงเป็นเนื้อเพลงภาษาอังกฤษ) และใช้ข้อมูลเนื้อเพลงที่คัดลอกมาจาก LyricWiki (โดยมีข้อมูลของศิลปินและแนวเพลงถูกรวมไว้เพื่อให้ผลลัพธ์ของโมเดลดีขึ้น) ถึงอย่างนั้นนักวิจัยก็ได้กล่าวว่าโมเดลนี้ยังมีข้อจำกัดอยู่บ้าง

“ในขณะที่ Jukebox แสดงถึงความก้าวหน้าในเรื่องคุณภาพของดนตรี ความเชื่อมโยง ความยาวของตัวอย่างเสียง และความสามารถในการปรับแต่งให้เข้ากับศิลปิน แนวเพลงและเนื้อเพลง แต่ถึงอย่างนั้นมันก็ยังมีช่องว่างที่สำคัญระหว่างบทเพลงที่สร้างขึ้นจากระบบนี้กับบทเพลงที่มนุษย์เป็นคนสร้างขึ้น ยกตัวอย่างเช่นในขณะที่เพลงที่สร้างขึ้นด้วย AI แสดงให้เห็นถึงการเชื่อมโยงกันของดนตรีในแนวนั้น ๆ ทำตามแพทเทิร์นคอร์ด และสร้างลูกโซโล่ที่น่าประทับใจ แต่เรากลับไม่พบโครงสร้างใหญ่เหมือนในบทเพลงที่สมบูรณ์ เช่น ท่อนฮุคที่มีการทวนซ้ำในบทเพลงนั่นเอง”

นอกจากนี้ยังมีปัญหาอื่น ๆ ที่เป็นประเด็นน่าขบคิด ดังที่ Cherie Hu นักเขียน นักวิจัย และ ผู้ผลิตพอดแคสต์ ชี้ให้เห็นบน Twitter ของเธอว่า Jukebox อาจเป็นหายนะทางลิขสิทธิ์เพลง

“เครื่องมือใหม่นี้จาก OpenAI ที่สร้างเพลงและเนื้อเพลงเลียนแบบสไตล์ของศิลปินดังได้อย่างอัตโนมัติรวมถึงการเลียนเสียงของพวกเขา – ไม่เพียงแต่เป็นเทคโนโลยีที่น่าดึงดูดและน่าประทับใจ แต่ยังน่ากลัวในแง่ของกฎหมายลิขสิทธิ์อีกด้วย https://openai.com/blog/jukebox/”

“Kanye West, Katy Perry, Lupe Fiasco รวมไปถึง Aretha Franklin, Frank Sinatra และ Elvis Presley นั้นอนุญาตให้ OpenAI ใช้บทเพลงและเสียงของพวกเขาเป็นสื่อในการฝึกอบรมสำหรับอัลกอริธึมการสังเคราะห์เสียง การแต่งเพลง และการเขียนเนื้อเพลงหรือเปล่า ? ซึ่งฉันขอเดาเลยว่าไม่”

เจ้าระบบนี้ฉลาดขนาดรู้ว่า เอลลา ฟิตซ์เจอรัลด์ นั้นร้องเพลงแบบไหน มีเนื้อเสียงเป็นอย่างไร อีกทั้งยังรู้ว่าดนตรีที่เล่นประกอบกับเสียงของเธอนั้นควรเป็นแบบไหน จนสามารถจำลองออกมาเป็นเพลง “At Long Last Love” ในรูปแบบที่ฟังดูเหมือนเอลลาร้องจริง ๆ แต่เป็นในแบบที่โคล พอร์เตอร์ผู้แต่งบทเพลงนี้ต้องคิดไม่ถึง

ลองฟังบทเพลง “At Long Last Love” ในเวอร์ชัน “จำลองขึ้นมาใหม่” (Re-renditions) เปรียบเทียบกับเวอร์ชันจริงที่ร้องโดย เอลลา ฟิตซ์เจอรัลด์ ดูครับ

Play video

ไม่เพียงแต่ เอลลา ฟิตซ์เจอรัลด์ เท่านั้น เจ้า Jukebox ยังสามารถแต่งเพลงและเขียนเนื้อร้องขึ้นมาใหม่ อีกทั้งยังร้องในสไตล์ของศิลปินดังมากมายได้อีก เช่น ในบทเพลง “Mitosis” ที่จำลองสไตล์ของราชาร็อกแอนด์โรล เอลวิส เพรสลีย์ มาอย่างชัดเจน

เนื้อเพลง “Mitosis” เขียนขึ้นจากระบบภาษาของ AI เพราะฉะนั้นมันจึงมีคำแปลก ๆ อย่าง mitosis, meiosis รวมไปถึงอักษรย่อที่ไม่รู้ความหมายอย่าง S. G. D.

From dust we came with humble start;

From dirt to lipid to cell to heart.

With [mitosis] with [meiosis] with time,

At last we woke up with a mind.

From dust we came with friendly help;

From dirt to tube to chip to rack.

With S. G. D. with recurrence with compute,

At last we woke up with a soul.

ใน Jukebox นอกจากบทเพลงสไตล์ เอลลา ฟิตซ์เจอรัลด์ กับ เอลวิส เพรสลีย์ ที่เราได้ยกตัวอย่างให้ฟังกันแล้ว ยังมีบทเพลงหลากแนวหลากสไตล์ตามศิลปินดังมากมายโดยแบ่งออกเป็น 4 หมวดด้วยกันคือ

“Unseen lyrics”

เป็นบทเพลงที่เกิดจากการเรียนรู้แนวดนตรี เนื้อเพลง และสไตล์ของศิลปินแล้วจำลองออกมาใหม่ โดยเนื้อเพลงที่ได้นั้นมาจากระบบภาษาของ AI และนักวิจัยเขียนขึ้นร่วมกัน เช่น

เคที เพอร์รี่ ในแนวพอป

แฟรงก์ ซินาตรา ในแนวเพลงคลาสสิกพอป

“Re-renditions”

เป็นหมวดที่ใช้เนื้อเพลงจากที่เรียนรู้มาแต่จำลองออกมาใหม่ให้เป็นเวอร์ชันที่แตกต่างจากเวอร์ชันต้นฉบับ เช่น เพลง “At Long Last Love” ของ เอลลา ฟิตซ์เจอรัลด์ ที่ได้ยกตัวอย่างไป และ “At Seventeen” ของ เซลีน ดิออน

ต้นฉบับ

Play video

“Completions”

เป็นหมวดที่ Jukebox จะใช้ 12 วินาทีแรกจากบทเพลงตัวอย่างแล้วจำลองส่วนที่เหลือตามสไตล์ของบทเพลงนั้น หมวดนี้จะได้ความมันส์ของการเห็นเพลงต้นฉบับผสมผสานความแปลกใหม่ลงไปเมื่อเพลงเล่นไปเรื่อย ๆ เช่นเพลง “Simpin Hallelujah” ในสไตล์ของ บรูโน่ มาร์ ที่เริ่มต้นด้วยเพลง “Uptown Funk”

สตีวี วันเดอร์ มาในแนว R&B ส่วนแรกมาจากเพลง “I Just Called To Say I Love You”

“Fun songs”

หมวดสุดท้ายที่ทำเอาฮา ๆ แต่สร้างสรรค์เป็นบ้าเลย เช่น การจับนักร้องดังมาดูเอ็ตกัน การใช้เนื้อเพลงดังแล้วมาใส่สไตล์ศิลปินคนอื่น หรือแม้กระทั่งเอาเพลงเด็กมาใส่สไตล์ศิลปินที่สุดจะไม่เข้ากับเพลงเด็กเลย เช่น

ดูเอ็ตระหว่าง แฟรงก์ ซินาตรา กับ เอลลา ฟิตซ์เจอรัลด์

เหมือน “Lose Yourself” ของ Eminem แต่คัฟเวอร์โดย คานเย เวสต์ ตอนหลังดูมั่วนิด ๆ แต่ฮาดี

หรือเอาเพลงเด็กมาใส่สไตล์ชาวร็อกของวง The Verve Pipe

Jukebox นับว่าเป็นความสำเร็จที่น่าดึงดูดใจที่ผลักดันขอบเขตความเป็นไปได้ของโลกแห่งเทคโนโลยีให้กว้างไกลขึ้น แต่ถึงกระนั้นมันก็ยังมีอีกหลายประเด็นที่ต้องพัฒนารวมไปถึงต้องขบคิดถึงปัญหาและผลกระทบที่อาจตามมาได้ แต่อย่างน้อยมันก็เป็นอีกขั้นของพัฒนาการทางเทคโนโลยีที่กำลังจะก้าวเข้ามามีอิทธิพลต่อโลกดนตรีได้อย่างน่ามหัศจรรย์และเรามิอาจมองข้ามได้ ไม่แน่ในวันข้างหน้าศิลปินคนโปรดของคุณอาจจะไม่ใช่คนจริง ๆ หากแต่เป็น AI ก็ได้นะ

ยังมีบทเพลงอีกมากมายจาก Jukebox ให้ลองเข้าไปฟังกันได้ที่ https://openai.com/blog/jukebox/

และหากสนใจในการทำงานของระบบนี้อย่างละเอียดสามารถอ่านบทความวิจัยเรื่อง Jukebox ได้ที่ Jukebox : A generative Model for Music

Source

openai

Jukebox : A generative Model for Music

jukebox

techcrunch

the verge

พิสูจน์อักษร : สุชยา เกษจำรัส