SHORT CUT
Google DeepMind เปิดตัว Gemini Robotics โมเดล AI ใหม่ล่าสุดบนพื้นฐาน Gemini 2.0 ที่จะนำความสามารถในการคิด วิเคราะห์ และลงมือทำ ผสาน AI มาสู่หุ่นยนต์อย่างที่ไม่เคยมีมาก่อน
Google DeepMind สร้างปรากฏการณ์ใหม่ในวงการหุ่นยนต์ ด้วยการเปิดตัวสองโมเดล AI ใหม่ล่าสุด ได้แก่ Gemini Robotics และ Gemini Robotics-ER ซึ่งพัฒนาต่อยอดมาจาก Gemini 2.0
โดยความพิเศษที่เหนือกว่ารุ่นก่อนๆ คือความสามารถในการ "ลงมือปฏิบัติ" ในโลกจริง ไม่ใช่แค่ประมวลผลข้อมูลในโลกดิจิทัลเท่านั้น
Gemini Robotics ไม่ได้เป็นเพียงโมเดล AI ที่ฉลาดในการประมวลผลข้อมูลเท่านั้น แต่ยังเป็นโมเดลที่สามารถสั่งการให้หุ่นยนต์เคลื่อนไหวและทำงานได้จริง (Vision-language-action model) โดย Google DeepMind ได้เน้นย้ำถึง 3 คุณสมบัติหลักที่ทำให้ Gemini Robotics โดดเด่นกว่าใคร
เก่งรอบด้าน ปรับตัวได้ทุกสถานการณ์ (Generality) : ไม่ว่าจะเจองานใหม่ที่ไม่เคยทำ ของที่ไม่เคยเห็น หรือสถานที่แปลกใหม่ Gemini Robotics ก็พร้อมลุย ทำงานได้สบายๆ แถมยังทำได้ดีกว่า AI ตัวอื่นๆ ถึงสองเท่า
โต้ตอบเก่ง เข้าใจง่าย (Interactivity) : สั่งงานได้ด้วยภาษาคน ไม่ว่าจะพูดภาษาอะไร หรือจะสั่งงานยากแค่ไหน Gemini Robotics ก็เข้าใจ แถมยังปรับตัวตามสถานการณ์ที่เปลี่ยนไปได้ทันที
คล่องแคล่ว แม่นยำ (Dexterity) : Gemini Robotics ทำให้หุ่นยนต์ทำงานที่ต้องใช้ความละเอียดอ่อนได้สบายๆ ไม่ว่าจะเป็นงานพับกระดาษ หรืองานหยิบจับของชิ้นเล็กๆ
ยิ่งไปกว่านั้น Gemini Robotics ยังสามารถปรับใช้กับหุ่นยนต์ได้หลากหลายประเภทอีกด้วย
ประกอบกับมี Gemini Robotics-ER ที่เป็นเสมือนผู้ช่วยนักพัฒนาในการสร้างสรรค์ฟังก์ชันใหม่ๆ, และให้ความสำคัญกับความปลอดภัยด้วยการพัฒนาระบบและการร่วมมือกับผู้เชี่ยวชาญ เพื่อให้ใช้งานได้อย่างมั่นใจและมีความรับผิดชอบ
การมาถึงของ Gemini Robotics ไม่ได้มีผลแค่ในวงการหุ่นยนต์เท่านั้น แต่มันส่งสัญญาณถึงอนาคตที่ AI จะเข้ามามีบทบาทในชีวิตประจำวันของเรามากขึ้น ไม่ว่าจะเป็น
Gemini Robotics ไม่ได้เป็นเพียงแค่ก้าวสำคัญของวงการ AI และหุ่นยนต์ แต่มันคือจุดเริ่มต้นของการเปลี่ยนแปลงครั้งใหญ่ ที่จะทำให้เทคโนโลยีเข้ามาใกล้ชิดกับชีวิตประจำวันของเรามากขึ้นอย่างที่ไม่เคยเป็นมาก่อน
ที่มา : DeepMind