SHORT CUT
OpenAI เขย่าวงการ AI อีกครั้ง เปิดตัว o3 และ o4-mini โมเดลเน้นการให้เหตุผลรุ่นใหม่ล่าสุด ที่สามารถหยุดคิดวิเคราะห์ก่อนตอบ สามารถเข้าใจภาพและใช้เครื่องมือได้หลากหลาย
OpenAI ประกาศเปิดตัวโมเดล AI สำหรับการให้เหตุผล รุ่นใหม่ 2 ตัว ได้แก่ o3 และ o4-mini เมื่อวันพุธที่ผ่านมา
โดยโมเดลเหล่านี้ได้รับการออกแบบมาให้มีความสามารถพิเศษในการ "หยุดคิด" หรือประมวลผลข้อมูลอย่างละเอียดก่อนที่จะสร้างคำตอบออกมา
OpenAI ยกให้ o3 เป็นโมเดลด้านการให้เหตุผลที่ล้ำหน้าที่สุดเท่าที่เคยมีมา โดยมีประสิทธิภาพเหนือกว่าโมเดลรุ่นก่อนๆ ของบริษัทในการทดสอบด้านคณิตศาสตร์, การเขียนโค้ด, การให้เหตุผล, วิทยาศาสตร์ และความเข้าใจภาพ
ขณะที่ o4-mini ถูกนำเสนอในฐานะตัวเลือกที่ให้ความสมดุลระหว่างราคา, ความเร็ว และประสิทธิภาพ ซึ่งเป็นปัจจัยสำคัญที่นักพัฒนามักพิจารณาในการเลือกใช้ AI สำหรับแอปพลิเคชันของตน
สิ่งที่ทำให้ o3 และ o4-mini แตกต่างจากโมเดลรุ่นก่อน คือความสามารถในการสร้างคำตอบโดยใช้เครื่องมือต่างๆ ภายใน ChatGPT ได้โดยตรง เช่น การท่องเว็บ (Web Browse), การรันโค้ด Python, การประมวลผลภาพ และการสร้างภาพ
โดยเริ่มตั้งแต่วันนี้เป็นต้นไป ผู้ใช้งานที่เป็นสมาชิกแผน Pro, Plus และ Team ของ OpenAI จะสามารถเข้าถึงโมเดลใหม่เหล่านี้ได้ รวมถึง o4-mini-high ซึ่งเป็นรุ่นย่อยของ o4-mini ที่ใช้เวลาประมวลผลนานขึ้นเล็กน้อยเพื่อเพิ่มความน่าเชื่อถือของคำตอบ
การเปิดตัวครั้งนี้ถือเป็นความพยายามของ OpenAI ในการแข่งขันกับยักษ์ใหญ่ในวงการ AI ระดับโลกอย่าง Google, Meta, xAI, Anthropic และ DeepSeek
แม้ว่า OpenAI จะเป็นผู้บุกเบิกโมเดล AI ด้านการให้เหตุผลอย่าง o1 แต่คู่แข่งก็ตามมาอย่างรวดเร็วด้วยโมเดลที่มีประสิทธิภาพเท่ากันหรือเหนือกว่า ซึ่งทำให้โมเดลประเภทนี้กำลังกลายเป็นสมรภูมิหลักของการพัฒนา AI
ที่น่าสนใจคือ o3 เกือบจะไม่ได้เปิดตัวใน ChatGPT โดย Sam Altman, CEO ของ OpenAI เคยส่งสัญญาณเมื่อเดือนกุมภาพันธ์ว่าบริษัทมีแผนจะทุ่มทรัพยากรให้กับโมเดลทางเลือกที่ซับซ้อนกว่าซึ่งรวมเทคโนโลยีของ o3 ไว้ด้วย แต่ดูเหมือนว่าแรงกดดันจากการแข่งขันทำให้ OpenAI ตัดสินใจเปลี่ยนแผนในที่สุด
ด้านประสิทธิภาพ OpenAI อ้างว่า o3 ทำคะแนนได้ถึง 69.1% ในการทดสอบ SWE-bench verified (โดยไม่มีการปรับแต่งพิเศษ) ซึ่งเป็นมาตรฐานวัดความสามารถด้านการเขียนโค้ด ถือเป็นระดับ State-of-the-art
ส่วนโมเดล o4-mini ก็ทำคะแนนได้ใกล้เคียงกันที่ 68.1% ซึ่งสูงกว่าโมเดลที่ดีที่สุดรองลงมาของ OpenAI อย่าง o3-mini ที่ทำได้ 49.3% และสูงกว่า Claude 3.7 Sonnet ของ Anthropic ที่ทำได้ 62.3%
จุดเด่นสำคัญอีกประการคือ OpenAI ระบุว่า o3 และ o4-mini เป็นโมเดลชุดแรกของบริษัทที่สามารถ "คิดวิเคราะห์ด้วยภาพ" ได้ ในทางปฏิบัติ
ผู้ใช้สามารถอัปโหลดภาพไปยัง ChatGPT เช่น ภาพสเก็ตช์บนไวท์บอร์ด หรือไดอะแกรมจากไฟล์ PDF แล้วโมเดลจะนำภาพเหล่านั้นไปวิเคราะห์ในระหว่างขั้นตอน "กระบวนการคิด" ก่อนตอบคำถาม
ความสามารถใหม่นี้ทำให้โมเดลเข้าใจภาพที่เบลอหรือมีคุณภาพต่ำได้ รวมถึงทำงานอย่างการซูมหรือหมุนภาพระหว่างการคิดวิเคราะห์
นอกเหนือจากความสามารถด้านภาพแล้ว o3 และ o4-mini ยังสามารถรันโค้ด Python ได้โดยตรงผ่านฟีเจอร์ Canvas ของ ChatGPT และค้นหาข้อมูลล่าสุดบนเว็บเมื่อถูกถามเกี่ยวกับเหตุการณ์ปัจจุบัน
สำหรับนักพัฒนา ทั้งสามโมเดล (o3, o4-mini, และ o4-mini-high) จะเปิดให้ใช้งานผ่าน API ของ OpenAI ได้แก่ Chat Completions API และ Responses API ทำให้นักพัฒนาสามารถสร้างแอปพลิเคชันโดยใช้โมเดลเหล่านี้ได้ในรูปแบบจ่ายตามการใช้งาน
ด้านราคา OpenAI ตั้งราคา o3 ไว้ค่อนข้างน่าสนใจเมื่อเทียบกับประสิทธิภาพที่เพิ่มขึ้น โดยอยู่ที่ 10 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็นอินพุต (ประมาณ 750,000 คำ) และ 40 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็นเอาต์พุต
ส่วน o4-mini มีราคาเท่ากับ o3-mini คือ 1.10 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็นอินพุต และ 4.40 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็นเอาต์พุต
OpenAI ยังเปิดเผยแผนการที่จะเปิดตัว o3-pro ในอีกไม่กี่สัปดาห์ข้างหน้า ซึ่งจะเป็น o3 เวอร์ชันที่ใช้ทรัพยากรในการประมวลผลสูงขึ้นเพื่อให้ได้คำตอบที่มีคุณภาพสูงยิ่งขึ้น โดยจะเปิดให้ใช้เฉพาะสมาชิก ChatGPT Pro เท่านั้น
Sam Altman ได้พูดว่า o3 และ o4-mini อาจเป็นโมเดล AI ด้านการให้เหตุผลแบบเดี่ยว (stand-alone) รุ่นสุดท้ายใน ChatGPT ก่อนการมาถึงของ GPT-5 ซึ่งบริษัทเคยกล่าวไว้ว่าจะเป็นโมเดลที่จะหลอมรวมโมเดลแบบดั้งเดิมอย่าง GPT-4.1 เข้ากับโมเดลด้านการให้เหตุผลเหล่านี้
ที่มา : TechCrunch