เมื่อเจอเหตุการณ์อ้ำอึ้งต้องพูดภาษาอังกฤษกับชาวต่างชาติ หลายคนคงนึกอยากเอาวุ้นแปลภาษาจากการ์ตูนโดราเอมอน ให้ชาวต่างชาติกินเข้าไปจะได้คุยกันรู้เรื่องใช่ไหมละ แต่ตอนนี้ไม่ต้องนึกถึงวุ้นแปลภาษาแล้วเพราะทีมพัฒนาของ Google’s Translatotron เค้าพัฒนาระบบให้สามารถแปลภาษาจากผู้พูดโดยตรงโดยที่เราไม่ต้องพิมพ์แล้ว

นับเป็นครั้งแรกกับโปรแกรมแปลภาษาเมื่อ Google และทีมพัฒนาได้แง้มโปรแกรมแปลภาษาจากผู้พูดโดยตรงที่สำคัญมันยังสามารถรักษาระดับโทนเสียง และจังหวะการพูดของฝ่ายตรงข้ามได้อีกด้วย การแปลนี้อยู่ภายใต้ระบบ End-To-End ที่จะแปลภาษาจากผู้พูดโดยตรง ซึ่งหากเป็นวิธีเก่า โปรแกรมจะทำการแปลงข้อความเสียงเป็นตัวอักษรก่อนค่อยแปลกลับเป็นข้อความเสียงส่งให้เรา ซึ่งอาจเกิดความผิดพลาดระหวางการแปลได้มากกว่า ทางบริษัทมีความหวังเป็นอย่างยิ่งว่ามันจะกลายเป็นต้นแบบโปรแกรมแปลภาษาในอนาคตได้

ระบบจะประมวลด้วย sequence-to-sequence Network เมื่อรับสัญญาณเสียงเข้าไปโปรแกรมจะแปลงเสียงเป็นความถี่และสร้าง Spectrogram ใหม่ในภาษาที่เราต้องการ ผลจากระบบนี้คือการแปลภาษาจะมีความแม่นยำ และ รวดเร็วกว่าระบบเดิมโปรแกรมนี้จะทำงานร่วมกับระบบแปลงเสียง ถึงแม้เสียงที่ได้ออกมาจะยังคงคล้ายหุ่นยนต์แต่ระบบจะทำการจับโทนเสียงของผู้พูดและปรับโทนเสียงสังเคราะห์ให้คล้ายผู้พูดมากที่สุด

ถ้าคุณอยากลองฟังคุณสามารถเข้าไปลองได้ที่ GitHub page ได้นะคะ

อ้างอิง