ฝ่ายขาย และการตลาด
085-848-2253[email protected]http://m.me/beartai
สมัครงาน/ฝึกงาน ติดต่อได้ที่
[email protected]
Read

ครั้งแรกที่ AI เว้าอีสานได้ “Typhoon Isan”ถอดเสียงและสะกดคำภาษาอีสาน ปูทางสู่ AI ที่เข้าใจคนไทยทุกถิ่น

Table of Content

ท่ามกลางความก้าวหน้าอย่างก้าวกระโดดของเทคโนโลยี AI ปัญหาหนึ่งที่ยังเป็นกำแพงใหญ่คือ โมเดลส่วนมากยังไม่รองรับ “ภาษาถิ่น” ได้ดีพอ ด้วยเหตุนี้ SCB 10X บริษัทในเครือ SCBX จึงเดินหน้าพัฒนา “Typhoon Isan” (ไต้ฝุ่น อีสาน) โมเดลถอดเสียงภาษาอีสานที่ไม่ใช่แค่ฟังไทยออก แต่สามารถ “เว้าอีสาน” ได้ด้วย พร้อมเปิดเป็น Open-Source ให้นักพัฒนานำไปต่อยอดได้ทันที

ทำความรู้จัก “Typhoon Isan

Typhoon Isan คือส่วนหนึ่งของโครงการ Open-Source AI Initiative จากทีมวิจัย SCB 10X ที่มุ่งพัฒนาโมเดล AI ให้เข้าใจบริบทของประเทศไทยอย่างลึกซึ้ง ทั้งในรูปแบบข้อความ เสียง และภาพ โดยล่าสุดได้เปิดตัวผลงานซีรีส์ใหม่ภายใต้คอนเซปต์ “TYPHOON เฮ็ดให้ AI ใจอีสาน” ได้แก่ 

  • Typhoon Isan ASR (Automatic Speech Recognition) โมเดลหลักที่เป็น Open-Source สามารถถอดเสียงภาษาอีสานออกมาเป็นข้อความได้อย่างแม่นยำและเป็นระบบรายแรก
  • Typhoon Isan TTS (Text-to-Speech) โมเดลแปลงข้อความกลับเป็นเสียงพูดภาษาอีสาน ที่ทำให้ AI สามารถ “เว้าอีสาน” ได้อย่างเป็นธรรมชาติ

    นอกจากนี้ ยังมีการเปิดเผยชุดข้อมูล Open Data เพื่อวางรากฐานให้นักพัฒนา ประกอบด้วย
  • Isan Speech Transcription Convention : แนวทางการถอดเสียงภาษาอีสานเป็นข้อความสำหรับการสร้างชุดข้อมูลเพื่องานด้านเทคโนโลยีทางเสียง 
  • Isan Spelling Standard : อักขรวิธีการสะกดคำอีสานด้วยอักษรไทย
  • Isan Speech Corpus : คลังข้อมูลเสียงภาษาอีสานจากหลากหลายจังหวัดในภาคตะวันออกเฉียงเหนือ
  • Isan Phonetic Dictionary : พจนานุกรมคำอ่านที่เชื่อมโยงคำกับการออกเสียงในภาษาอีสาน

ทำไมต้องเริ่มที่ “ภาษาอีสาน”  

ที่ผ่านมาเทคโนโลยีถอดเสียง (ASR) มักสะดุดเมื่อเจอกับภาษาถิ่น เพราะขาดแคลนข้อมูลในระบบดิจิทัล ทำให้ AI จับใจความหรือสำเนียงผิดเพี้ยน SCB 10X จึงเลือกประเดิมด้วย “ภาษาอีสาน” เนื่องจากมีผู้ใช้งานจริงกว่า 20 ล้านคน หรือ 1 ใน 3 ของประชากรไทย ซึ่งกระจายตัวอยู่ในทุกอุตสาหกรรม และหากมองในเรื่องของเศรษฐกิจแล้ว ภาคอีสานสามารถสร้างมูลค่า GDP รวมกว่า 1.8 แสนล้านบาท คิดเป็น 10% ของมูลค่าเศรษฐกิจไทย

การทำให้ AI เข้าใจภาษาอีสาน จึงไม่ใช่แค่เรื่องของการอนุรักษ์วัฒนธรรม แต่คือการ “ปลดล็อก” การสื่อสารและธุรกรรมในโลกดิจิทัลให้ครอบคลุมมากขึ้น

ความท้าทายของ “ภาษา” จุดเริ่มต้นการต่อยอด

โจทย์ที่ยากที่สุดของการพัฒนา AI ภาษาอีสาน คือการที่ภาษานี้เป็น “ภาษาพูด” ที่ยังไม่มีมาตรฐานการเขียนที่ชัดเจน ทำให้การเทรน AI ทำได้ยาก ทีมวิจัย SCB 10X จึงร่วมมือกับนักภาษาศาสตร์ ชุมชนท้องถิ่น และผู้เชี่ยวชาญ พัฒนาโครงการ Typhoon Isan เพื่อวางรากฐานใหม่ทั้งหมด ได้แก่

  • กำหนดนิยามของอีสาน : จำแนกสำเนียงต่าง ๆ ในถิ่นอีสานและหาลักษณะสำคัญร่วมกัน เพื่อคนส่วนใหญ่เข้าใจตรงกัน
  • สร้างระบบการสะกดคำ : อักขรวิธีการสะกดคำภาษาอีสานด้วยอักษรไทย เช่น กระโปรงเหี้ยน ข้อยเป็นคนอีสาน
  • สร้างวิธีเก็บข้อมูลเสียงพูด : ชุดข้อมูลเสียงพูดภาษาอีสานจากเจ้าของภาษา ให้พูดออกมาเป็นธรรมชาติ
  • สร้างกระบวนการกำกับข้อมูล : เพื่อให้ได้ข้อมูลที่มีคุณภาพและแม่นยำมากขึ้นจึงได้มีการกำกับข้อมูลอยู่สม่ำเสมอ

Typhoon Isan ถือเป็นก้าวสำคัญที่กลุ่ม SCBX ตั้งใจขับเคลื่อนวงการ AI ไทย ด้วยการยกระดับ “ภาษาถิ่น” สู่มาตรฐานดิจิทัล พร้อมตอกย้ำความมุ่งมั่นในการพัฒนานวัตกรรมเพื่อคนไทย เพื่อสร้าง AI ที่ไม่เพียงแค่เก่ง แต่ต้อง “เข้าใจ และเข้าถึงหัวใจของคนไทยทุกคนได้มากขึ้น”

พิสูจน์อักษร : รัชนี สังข์แก้ว

Highlight

How to แต่งรูป “Hole Paper” อวดความคิวต์ สไตล์ Gen Z อัปเลเวลฟีด Instagram ให้ดูชิก !

17/04/2026
Read More

Canva เปิดตัว AI 2.0 เปลี่ยนวิธีทำงานและดีไซน์ของคนทั่วโลก ยกระดับ Canva สู่หัวใจหลักที่ขับเคลื่อนทุกการทำงานให้สำเร็จ

17/04/2026
Read More

มูฟออน หรือ ยึดติด ? Grief Tech เทคฯ เพื่อเยียวยาความเศร้า ผ่านการจำลองตัวตนของคนที่จากไป

17/04/2026
Read More

แค่ความเก่งอาจไม่พอ ! เปิด 15 Insights ที่คนทำงานต้องรู้ในปี 2026 จากงาน “PEOPLE PERFORMANCE CONFERENCE 2026”

17/04/2026
Read More

‘คุณทุกคนคือลูกเรือ’ ถอดรหัสใจ คริสตินา โคค จากเด็กสาวในฟาร์ม สู่สตรีผู้ถูกจารึกชื่อบนอวกาศ

17/04/2026
Read More

เจาะอินไซต์สงกรานต์ 2569 : เมื่อ AI จากทรู เผย “อีสาน” คือหมุดหมายหลัก และ “จีน” ครองบัลลังก์นักท่องเที่ยว

16/04/2026
Read More

Related Content