SHORT CUT
Gemini 2.0 เป็นโมเดล AI ล่าสุดจาก Google ยักษ์ใหญ่ด้านเทคโนโลยีจากสหรัฐฯ และเวอร์ชันแรกที่ปล่อยออกมาให้ได้ใช้กันแล้วคือ Gemini 2.0 Flash ที่รวดเร็วและทรงพลัง
ซึ่งบริษัทระบุว่า นี่คือจุดเริ่มต้นของ “ยุคแห่งตัวแทน” ที่ AI สามารถทำงานต่าง ๆ ได้โดยไม่ต้องอาศัยคำสั่งจากมนุษย์
Google เปิดตัว Gemini AI เมื่อกว่า 1 ปีก่อน ถือเป็นการเผยให้เห็นถึงการเริ่มยุคใหม่ของยักษ์ใหญ่เสิร์ชเอนจินรายนี้ที่ปล่อย AI Overviews, Gemini แชตบอต AI และอีกมากมายออกมา ไม่น้อยหน้าผู้พัฒนาเจ้าอื่น ๆ
เบื้องต้น Google เปิดให้ใช้งาน Gemini 2.0 Flash เฉพาะนักพัฒนาซอฟแวร์หรือเป็นโมเดลทดลองสำหรับผู้สมัครสมาชิกใช้บริการ Gemini Advanced โดย Gemini 2.0 Flash มาพร้อมกับประสิทธิภาพที่เหนือชั้นกว่าเวอร์ชันก่อนหน้าเกือบทั้งหมดในการทดสอบ เช่น การเขียนโค้ด การคำนวณทางคณิตศาสตร์ การให้เหตุผลและความรู้ทั่วไป
Sundar Pichai ซีอีโอของ Google ระบุว่า Gemini 2.0 มีความสามารถในการให้เหตุผลขั้นสูงและสิ่งเหล่านี้จะมากับ AI Overviews ใน Google Search เพื่อมอบคำตอบที่แม่นยำยิ่งขึ้นให้กับผู้ใช้สำหรับคำถามที่มีความซับซ้อนและหลายขั้นตอน
Gemini 2.0 ที่น่าจะออกเวอร์ชัน Pro ตามมาด้วยนั้น เป็นโมเดลที่ขับเคลื่อนผลิตภัณฑ์ Google Gemini ทั้งหมด รวมถึง แอปพลิเคชัน Android, แชตบอตและ Experiments ต่าง ๆ
Gemini 2.0 ได้รับการขนามนามจาก Google ว่าเป็น “ยุคแห่งตัวแทน” เป็นโมเดลที่มีความสามารถในการให้เหตุผลขั้นสูงคล้ายกับ o1 ของ OpenAI แต่ยังสามารถสร้างผลลัพธ์รูปภาพ คำพูด ข้อความและอื่น ๆ ได้ด้วย
โมเดลแรกในตระกูล Gemini 2.0 ที่ได้รับการปล่อยออกมา คือ Gemini 2.0 Flash แต่รุ่นปัจจุบันยังเป็นรุ่นทดลอง ซึ่ง Google ระบุว่า เร็วขึ้นเป็น 2 เท่าของ Gemini Pro 1.5 รุ่นก่อนหน้า และมีประสิทธิภาพเหนือกว่ารุ่นเดิมเกือบทั้งหมดการในการทดสอบเกณฑ์มาตรฐานสำคัญต่าง ๆ
Demis Hassabis ซีอีโอของ Google DeepMind อธิบายว่า Gemini 2.0 Flash เป็นโมเดลที่ใช้งานได้จริง โดยมีค่าเวลาแฝงที่ต่ำและมาพร้อมกับประสิทธิภาพที่ได้รับการปรับปรุง โดยสามารถสร้างสรรค์รูปภาพ ข้อความและประโยคต่าง ๆ ได้เอง จากเมื่อก่อนที่ Gemini ต้องดึงโมเดลอื่น ๆ เช่น Imagen ขึ้นมาเพื่อทำงานเหล่านั้น
นอกจากนี้ยังมีประสิทธิภาพเหนือกว่าโมเดล Gemini รุ่นก่อนหน้าทั้งหมดในด้านการให้เหตุผล เข้าใจภาพได้ดีขึ้นอย่างมาก สามารถแปลคำพูดจากเสียงได้อย่างรวดเร็ว และสามารถวิเคราะห์วิดีโอได้ดีกว่า Pro 1.5 ด้วย
เมื่อ Gemini 1.0 เปิดตัว เราอยู่ในยุคแชตบอทของโมเดล AI ซึ่งเราสามารถพูดคุยโต้ตอบกับโมเดลเหล่านี้และออกคำสั่งให้สร้างเนื้อหาได้ จากนั้น ด้วยการมาถึงของ o1 จาก OpenAI เราก็เข้าสู่ยุคการให้เหตุผลและยุคของตัวแทนไปพร้อม ๆ กัน
“ตัวแทน” (Agents) ใน AI คือจุดที่โมเดลสามารถสร้างเวอร์ชันของตัวเองในการทำงานต่าง ๆ แทนผู้ใช้ได้ โดย Google ยังได้เปิดตัวเครื่องมือตัวแทนใหม่ใน Gemini ที่สามารถท่องเว็บแทนคุณได้ และส่งกลับมาเป็นรายงานในหัวข้อที่ซับซ้อน ซึ่งเรียกว่า “Deep Research” และรวมอยู่ใน Gemini Advanced
ซีอีโอของ Google DeepMind อธิบายว่า การใช้งานจริงของตัวแทน AI เป็นพื้นที่การวิจัยที่เต็มไปด้วยความเป็นไปได้อันน่าตื่นเต้น เรากำลังสำรวจขอบเขตใหม่นี้ด้วยต้นแบบที่สามารถช่วยผู้คนทำงานให้สำเร็จและจัดการงานต่าง ๆ ให้สำเร็จ
โครงการนี้ยังรวมถึง Project Astra ผู้ช่วยเสมือน และ Project Mariner ที่สามารถเข้าใจและให้เหตุผลกับข้อมูลในหน้าจอเบราว์เซอร์ รวมถึง Jules ตัวแทนปัญญาประดิษฐ์ช่วยนักพัฒนาแก้โค้ดต่าง ๆ
ปัจจุบัน Gemini 2.0 Flash มีให้บริการสำหรับผู้ที่สมัครสมาชิก Gemini Advanced และเบื้องต้นยังเป็นรุ่นทดลอง แต่ผู้ที่มีโอกาสได้ใช้งานแล้วบอกเป็นเสียงเดียวกันว่าใช้งานได้ดี
นอกจากนี้ ยังสามารถใช้ Gemini 2.0 Flash เป็นนักพัฒนาใน Gemini API หรือ Google Gemini AI Studio อันทรงพลังได้ ซึ่ง Google ระบุว่า จะปล่อยออกมาพร้อมกับผลิตภัณฑ์ทั้งหมดของ Google ในปี 2025
ที่มา