SCB 10X หวังปั้น Typhoon ให้เป็น ChatGPT เวอร์ชันภาษาไทย ด้วยการพัฒนาโมเดลภาษาขนาดใหญ่หรือ LLM สำหรับภาษาไทยขึ้นมา แต่ยังใช้งานจริงไม่ได้ ต้องลงทะเบียนรอใช้งาน
เอสซีบี เท็นเอกซ์ (SCB 10X) เปิดตัว "ไต้ฝุ่น” (Typhoon) โมเดลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai)
นับว่าเป็นโมเดลภาษาไทยขนาดใหญ่ที่มีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ที่เปิดให้เข้าถึงข้อมูลภาษาไทย โดยเป็นการเก็บรวบรวมและจัดเตรียมข้อมูลมาจากข้อสอบภาษาไทยซึ่งมีความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย
จุดมุ่งหมายในการพัฒนา “ไต้ฝุ่น” (Typhoon) ออกมานั้น เพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ถูกฝึกฝนด้วยภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยมีข้อมูลไม่มากพอต่อการนำไปให้ AI ใช้ในการเรียนรู้
จากผลการทดลองในชุดข้อสอบภาษาไทยแสดงให้เห็นว่า Typhoon มีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย ซึ่งเป็นโมเดลที่อยู่เบื้องหลัง ChatGPT
โดยมีพารามิเตอร์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย
หลังจากลองกดเข้าไปดูที่หน้าเว็บไซต์ และข้อมูลอ้างอิงว่า Typhoon-7B ในเวอร์ชัน Pretrained model ได้รับใบอนุญาต Apache 2.0 อย่างไม่มีค่าใช้จ่าย ซึ่งมีรายงานเชิงเทคนิคประกอบข้อมูลในส่วนนี้
อย่างไรก็ตาม ทางทีมข่าว SPRiNGNews ได้หาข้อมูลเพิ่มเติม พบว่า ยังไม่มีกำหนดการที่ชัดเจนว่าจะสามารถใช้งาน Typhoon ระบบ AI นี้ได้เมื่อไหร่ แต่คาดว่าจะใช้งานได้ภายในปีนี้อย่างแน่นอน หากใครสนใจอยากทดลองใช้งานเอไอเวอร์ชันภาษาไทยก็สามารถ เข้าไปที่ลิงก์ opentyphoon.ai เพื่อลงทะเบียนเป็นหนึ่งในผู้ทดลองใช้งานกลุ่มแรกก่อนได้
อ่านข่าวอื่นๆ เพิ่มเติม