NPU เป็นศัพท์ใหม่ในวงการ AI ที่กำลังมาแรงตอนนี้ ซึ่งสร้างความสับสนให้กับหลายคนที่แม้แต่ CPU หรือ GPU ก็ยังสับสนว่ามันต่างกันยังไง ซึ่งคนทั่วไปก็อาจไม่รู้ว่า NPU เริ่มสอดแทรกเข้ามาในอุปกรณ์ไอทีที่เราใช้กันบ้างแล้ว บทความนี้จะเล่าให้เห็นว่า NPU คืออะไร และมันสำคัญกับวงการ AI และชีวิตประจำวันอย่างไรบ้าง
เริ่มที่ความหมายกันก่อน NPU ย่อมาจาก Neural Processing Unit หรือแปลว่าหน่วยประมวลผลประสาท ซึ่งเป็นชิปหน่วยประมวลผลที่ได้รับการออกแบบมาเพื่อรองรับการทำงานของ AI โดยเฉพาะ
NPU ยังถูกออกแบบมาเพื่อเร่งการทำงานของ Neural Network หรือโครงข่ายประสาทที่สร้างขึ้นเลียนแบบวิธีการทำงานของระบบสมองของมนุษย์ และเป็นหัวใจในการทำงานของ AI
NPU ยังมีความเชี่ยวชาญในการทำงานที่เกี่ยวกับ AI เช่น การจดจำเสียง การเบลอภาพพื้นหลังของวิดีโอคอล และกระบวนการในการตัดต่อสื่อต่าง ๆ
ที่ NPU ทำได้มากขนาดนี้ก็เป็นผลมาจากเขียนโปรแกรมลงบนซอฟต์แวร์และฮาร์ดแวร์ที่มีความเฉพาะทาง ออกแบบมาเพื่อสำหรับการคำนวณบนโครงข่ายประสาทและ AI เป็นการเฉพาะ
สิ่งที่ทำให้ NPU แตกต่างจากชิปประมวลอื่น ๆ (เช่น CPU และ GPU) ก็คือ NPU เกิดมาเพื่อการคำนวณแบบขนานที่เน้นข้อมูลเป็นหลัก แถมยังมีความซับซ้อน ทำงานได้หลากหลาย และความยืดหยุ่นสูง ทำให้มันมีประสิทธิภาพในการประมวลข้อมูลภาพและวิดีโอขนาดมหึมาที่ใช้สำหรับการฝึกฝน AI และรองรับการประมวลผลโครงข่ายประสาทได้สูงมาก

ส่วน CPU หรือ Central Processing Unit (หน่วยประมวลผลกลาง) เป็นเหมือนมันสมองของคอมพิวเตอร์ มันมีจำนวนคอร์น้อย เน้นทำงานทั่ว ๆ ไป แต่หลากหลาย เช่น รันโปรแกรม และใช้คำสั่งต่าง ๆ ซึ่งจะไม่ได้ออกแบบมาให้ทำงานเฉพาะทางเหมือน GPU และ NPU
ในทางกลับกัน GPU หรือ Graphic Processing Unit (หน่วยประมวลกราฟิก) มีคอร์ หรือหน่วยการประมวลผลในระดับฮาร์ดแวร์ ในการคำนวณงานทั่ว ๆ ไปในปริมาณที่มากกว่า เนื่องจากมีคอร์ที่มากกว่า แต่จะไม่ซับซ้อนเท่ากับ NPU เหมาะสำหรับทำงานหนักแต่ไม่ซับซ้อนมากอย่างการเรนเดอร์กราฟิก
| CPU | GPU | NPU |
|---|---|---|
| คอร์น้อย เน้นทำงานทั่ว ๆ ไปแต่หลากหลาย | คอร์มากที่สุด เน้นทำงานอย่างเดียวแต่ทำหนัก แบ่งการทำงานเป็นหลายส่วนเพื่อทำพร้อม ๆ กัน กินไฟมาก | คอร์มากกว่า CPU แต่ไม่เท่า GPU เน้นการประมวล AI ที่เป็นงานเบา ๆ แต่ทำซ้ำ ๆ กินไฟน้อย |
ในระดับสินค้าบริโภค โดยมากแล้ว NPU จะถูกผนวกเข้ากับ CPU GPU หรือชิปประมวลผลอื่น ๆ อย่างในชิป Intel Core และชิปซีรีส์ Ryzen 8040 ของค่ายแดง สำหรับการประมวลผล AI แบบบนอุปกรณ์ (On-Device) เลย ส่วนใน SoC สำหรับสมาร์ตโฟนนั้นมี NPU อยู่ในตัวมานานตั้งแต่ยุค Huawei P20 Pro แล้ว
อย่างในค่ายเขียว NVIDIA จะใช้สิ่งที่เรียกว่า Tensor Core เช่นเดียวกับคู่แข่งอย่าง AMD และ Intel ก็ผนวก IC ในลักษณะนี้เข้าไปอยู่ใน GPU ที่ใช้บนแล็ปท็อป สมาร์ตโฟน และอุปกรณ์อื่นบ้างแล้ว
ขณะที่ในระดับอุตสาหกรรม หรือศูนย์ข้อมูล NPU จะถูกแยกต่างหากจากตัวประมวลผลอื่น ๆ บนเมนบอร์ด เพื่อให้มันทำงานเต็มประสิทธิภาพ
แน่นอนว่ายักษ์ใหญ่วงการชิปก็ย่อมไม่พลาดการแข่งขันขุมทรัพย์ใหม่อย่าง NPU
คู่แข่งสำคัญอย่าง AMD ที่หมายมั่นจะท้าชน NVIDIA ที่เป็นเจ้าตลาดชิปประมวลผล AI ก็ประกาศ XDNA สถาปัตยกรรมชิป NPU มาสู้ด้วย โดย XDNA จะมีหน่วยความจำและตัวจัดการกระแสข้อมูล (Data Flow) บนชิปสำหรับ AI แทนการต้องไปดึงมาจากแคช เพื่อลดการใช้พลังงานและเพิ่มประสิทธิภาพการประมวลผล AI
เช่นเดียวกับ Intel ที่กำลังลุ้นว่าจะตกขบวนจากการที่เจ้าดังเริ่มทิ้งตัวเองไปใช้สถาปัตยกรรมของ ARM ก็ประกาศเปิดตัวสถาปัตยกรรมชิปใหม่ที่รวมเอา NPU มาไว้เหมือนกัน ทั้ง Meteor Lake ที่ใช้บนมือถือ และ Lunar Lake สำหรับบนคอมพิวเตอร์

NVIDIA พัฒนาชิป GPU ที่ใช้สถาปัตยกรรม Ada Lovelace สำหรับแล็ปท็อปที่มาพร้อมกับ NPU (ในรูปแบบของ Tensor Core) เพื่อให้ NPU รองรับการประมวลผล AI ในหน้างานเบา ๆ ส่วนงานหนัก ๆ ก็ให้ GPU มาช่วยอุ้ม
สำหรับประสิทธิภาพของแต่ละค่ายนั้น ปัจจุบันมีหน่วยในการวัดการประมวลผล AI ที่เรียกว่า TOPS ย่อมาจาก Trillions of Operations Per Second หรือคำสั่งในระดับล้านล้านคำสั่งที่ตัวประมวลผลจะประมวลผลได้ต่อวินาที
ทางฝั่งของมือถือ Meteor Lake ของ Intel มีความสามารถสูงสุดอยู่ที่ราว 11.5 TOPS ส่วน Ryzen AI 300-series ชิปมือถือของ AMD ระบุว่ามีประสิทธิภาพแรงทะลุ 50 TOPS
| TOPS ของ NPU บนมือถือ | TOPS ของ NPU บน PC และแล็ปท็อป |
|---|---|
| 11.5 ~ 50 | 38 – 1,300 |
ในฝั่งของ PC และแล็ปท็อป เริ่มจาก Intel ประกาศว่า NPU 4 ของ Lunar Lake จะมีประสิทธิภาพอยู่ที่ราว 48 TOPS แต่เมื่อรวมกับ CPU และ GPU ที่อยู่บนชิปจะรวมกันได้มากถึง 120 TOPS
ทางด้าน Qualcomm ก็ไม่น้อยหน้า โฆษณาว่าชิป Snapdragon X-Series ของตัวเองที่มี NPU ประกบมาด้วยสามารถทำได้ถึง 45 TOPS ส่วน M4 ชิปเรือธงของ Apple อยู่ที่ราว ๆ 38 TOPS
แต่ผู้ชนะในวงการ TOPS แน่นอนว่าคงเป็นเจ้าตลาดอย่าง NVIDIA ที่โฆษณาว่า GPU ในตระกูล Ada Lovelace มาพร้อมกับ NPU ที่รวมกันแล้วมีค่า TOPS อย่างน้อย 154 และสูงสุดเป็นของ RTX 4090 ที่มีค่า TOPS ทะลุ 1,300
เรียกได้ว่าทิ้งเจ้าอื่นไม่เห็นฝุ่นเลยทีเดียว
อย่างไรก็ดี ก็ไม่ใช่ทุกคนที่เชื่อมั่นใน NPU ขนาดนั้น บ้างก็ว่า NPU ไม่ได้จำเป็นในการประมวลผล AI เพราะ GPU ก็ทำได้อยู่แล้ว
ในขณะเดียวกันการที่ ทุกเจ้ายักษ์ใหญ่แข่งขันกันเพื่อพัฒนาสินค้าที่แปะป้าย AI ในแทบจะทุกอย่าง ตั้งแต่วิดีโอเกม ไปจนถึงเก้าอี้นวด เราน่าจะได้เห็นการแข่งขันพัฒนา NPU เป็นตัวของตัวเองได้มากขึ้นเรื่อย ๆ
ซึ่งก็คงต้องพิสูจน์กันต่อไปสำหรับเทคโนโลยีที่มีความใหม่มาก ๆ ระดับนี้













