SHORT CUT
Google เปิดตัว Gemini 2.5 Pro Experimental โมเดล AI ล่าสุดที่มาพร้อมความสามารถ "หยุดคิด" เพื่อการให้เหตุผลที่ลึกซึ้งขึ้น อ้างเป็นโมเดลฉลาดที่สุดเท่าที่เคยมีมา
Google ได้ประกาศเปิดตัว Gemini 2.5 ตระกูลโมเดล AI รุ่นใหม่ ที่ออกแบบมาโดยเน้นความสามารถในการ "ให้เหตุผล" (Reasoning) เป็นพิเศษ ซึ่งเป็นคุณสมบัติที่ช่วยให้ AI ไม่เพียงแค่ตอบสนองทันที
แต่จะใช้เวลาและทรัพยากรประมวลผลเพิ่มเติมเพื่อวิเคราะห์ข้อมูล ตรวจสอบข้อเท็จจริง และพิจารณาหาเหตุผลประกอบอย่างรอบด้านก่อนที่จะสร้างคำตอบออกมา ถือเป็นอีกก้าวสำคัญในการพัฒนา AI ให้มีความสามารถซับซ้อนและใกล้เคียงกับการคิดของมนุษย์มากขึ้น
Google ได้เปิดตัว Gemini 2.5 Pro Experimental ซึ่งเป็นโมเดล AI แบบหลายรูปแบบ (multimodal) ที่สามารถประมวลผลข้อมูลได้หลากหลายประเภท และมีความสามารถในการให้เหตุผลขั้นสูง
โดย Google อ้างว่านี่คือโมเดลที่ชาญฉลาดที่สุดของบริษัทในปัจจุบัน โมเดลนี้พร้อมใช้งานแล้วตั้งแต่วันอังคารที่ผ่านมาผ่านแพลตฟอร์มสำหรับนักพัฒนา และสำหรับผู้ใช้งาน Gemini Advanced ที่ต้องจ่ายรายเดือนประมาณ 20 ดอลลาร์สหรัฐ หรือ 750 บาท
Google อ้างว่า Gemini 2.5 Pro มีประสิทธิภาพเหนือกว่าโมเดลระดับสูงรุ่นก่อนๆ ของตนเอง และเหนือกว่าคู่แข่งชั้นนำบางรายในหลายๆ การทดสอบ โดยเฉพาะอย่างยิ่งในการสร้างเว็บแอปพลิเคชันที่สวยงามและแอปพลิเคชันการเขียนโค้ดแบบ Agentic
การแก้ไขโค้ด (Aider Polyglot) : Gemini 2.5 Pro ทำคะแนนได้ 68.6% เหนือกว่าโมเดลชั้นนำจาก OpenAI, Anthropic และ DeepSeek
การพัฒนาซอฟต์แวร์ (SWE-bench Verified) : ทำคะแนนได้ 63.8% เหนือกว่า o3-mini (OpenAI) และ R1 (DeepSeek) แต่ยังตามหลัง Claude 3.7 Sonnet (Anthropic) ที่ทำได้ 70.3%
ความรู้รอบด้าน (Humanity’s Last Exam) ทำคะแนนได้ 18.8% ซึ่งดีกว่าโมเดลเรือธงของคู่แข่งส่วนใหญ่
นอกจากนี้ Gemini 2.5 Pro ยังมาพร้อมกับ Context Window ขนาด 1 ล้านโทเค็น ในช่วงแรก ทำให้สามารถประมวลผลข้อมูลนำเข้าได้มากถึงประมาณ 750,000 คำในคราวเดียว (เทียบเท่าหนังสือชุด "Lord of The Rings" ทั้งหมด) และมีแผนจะขยายเป็น 2 ล้านโทเค็นในอนาคตอันใกล้
ทิศทางใหม่ของ Google คือการฝังความสามารถด้านการให้เหตุผลนี้ไว้ในโมเดล AI ใหม่ๆ ทุกตัวที่จะเปิดตัวในอนาคต
การเคลื่อนไหวนี้เกิดขึ้นท่ามกลางการแข่งขันที่เข้มข้นในอุตสาหกรรม AI นับตั้งแต่ OpenAI ได้จุดประกายด้วยการเปิดตัว o1 ซึ่งเป็นโมเดล AI ที่เน้นการให้เหตุผลตัวแรกเมื่อเดือนกันยายน 2567
ทำให้ยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Anthropic, DeepSeek, Google และ xAI ต่างเร่งพัฒนาโมเดลของตนเองเพื่อไล่ตามหรือก้าวข้ามขีดความสามารถดังกล่าว
เทคนิคการให้เหตุผลช่วยให้ Gemini 2.5 สามารถทำงานที่ซับซ้อน เช่น การแก้ปัญหาคณิตศาสตร์และการเขียนโค้ด ได้อย่างมีประสิทธิภาพมากขึ้นอย่างเห็นได้ชัด
หลายฝ่ายในวงการเทคโนโลยีเชื่อว่าโมเดลประเภทนี้จะเป็นหัวใจสำคัญของ AI Agents หรือระบบ AI อัตโนมัติที่สามารถทำงานต่างๆ ได้ด้วยตัวเองโดยต้องการการควบคุมจากมนุษย์น้อยมาก อย่างไรก็ตาม ข้อจำกัดสำคัญคือต้นทุนที่สูงขึ้นในการพัฒนาและใช้งานโมเดลเหล่านี้
แม้ Google จะเคยทดลองกับโมเดลที่มีความสามารถคล้ายคลึงกันมาก่อน (เช่น Gemini เวอร์ชัน "คิดได้" ที่เปิดตัวเมื่อเดือนธันวาคม) แต่ Gemini 2.5 ถือเป็นความพยายามครั้งสำคัญที่สุดของ Google ในการท้าชิงความเป็นผู้นำกับโมเดลตระกูล "o" ของ ChatGPT
การเปิดตัว Gemini 2.5 และ Gemini 2.5 Pro Experimental ครั้งนี้ นับเป็นก้าวที่น่าตื่นเต้นและมีความสำคัญอย่างยิ่งของ Google ในการแข่งขันพัฒนา AI แสดงให้เห็นถึงความมุ่งมั่นในการพัฒนาความสามารถด้าน "การให้เหตุผล" ซึ่งถูกมองว่าเป็นกุญแจสำคัญสู่ AI ที่มีความสามารถสูงขึ้นและทำงานได้ซับซ้อนยิ่งขึ้น
ที่มา : TechCrunch, Google Blog