Google ปล่อย Gemini 2.0 Flash โมเดล AI รุ่นใหม่ ทรงพลัง ไม่ต้องรอคำสั่งมนุษย์

12 Dec 2024

Gemini 2.0 เป็นโมเดล AI ล่าสุดจาก Google ยักษ์ใหญ่ด้านเทคโนโลยีจากสหรัฐฯ และเวอร์ชันแรกที่ปล่อยออกมาให้ได้ใช้กันแล้วคือ Gemini 2.0 Flash ที่รวดเร็วและทรงพลัง

SHORT CUT

Google เปิดตัว Gemini 2.0 พร้อมระบุว่านี่คือจุดเริ่มต้นของ "ยุคแห่งตัวแทน" ที่ AI สามารถทำงานแทนมนุษย์ได้ มีความสามารถคล้ายกับ o1 ของ OpenAI
Gemini 2.0 Flash ซึ่งเป็นโมเดล AI รุ่นใหม่ ถูกปล่อยให้ทดลองใช้ก่อน โดยมีความเร็วขึ้นเป็น 2 เท่าของ Gemini Pro 1.5 รุ่นก่อนหน้า และประสิทธิภาพเหนือกว่า
ซีอีโอของ Google ระบุว่า Gemini 2.0 มีความสามารถในการให้เหตุผลขั้นสูง สร้างเนื้อหา และช่วยงานซับซ้อน พร้อมเตรียมเปิดตัวผลิตภัณฑ์ใหม่ในอนาคต

Gemini 2.0 เป็นโมเดล AI ล่าสุดจาก Google ยักษ์ใหญ่ด้านเทคโนโลยีจากสหรัฐฯ และเวอร์ชันแรกที่ปล่อยออกมาให้ได้ใช้กันแล้วคือ Gemini 2.0 Flash ที่รวดเร็วและทรงพลัง

ซึ่งบริษัทระบุว่า นี่คือจุดเริ่มต้นของ “ยุคแห่งตัวแทน” ที่ AI สามารถทำงานต่าง ๆ ได้โดยไม่ต้องอาศัยคำสั่งจากมนุษย์

Google เปิดตัว Gemini AI เมื่อกว่า 1 ปีก่อน ถือเป็นการเผยให้เห็นถึงการเริ่มยุคใหม่ของยักษ์ใหญ่เสิร์ชเอนจินรายนี้ที่ปล่อย AI Overviews, Gemini แชตบอต AI และอีกมากมายออกมา ไม่น้อยหน้าผู้พัฒนาเจ้าอื่น ๆ

เบื้องต้น Google เปิดให้ใช้งาน Gemini 2.0 Flash เฉพาะนักพัฒนาซอฟแวร์หรือเป็นโมเดลทดลองสำหรับผู้สมัครสมาชิกใช้บริการ Gemini Advanced โดย Gemini 2.0 Flash มาพร้อมกับประสิทธิภาพที่เหนือชั้นกว่าเวอร์ชันก่อนหน้าเกือบทั้งหมดในการทดสอบ เช่น การเขียนโค้ด การคำนวณทางคณิตศาสตร์ การให้เหตุผลและความรู้ทั่วไป

Sundar Pichai ซีอีโอของ Google ระบุว่า Gemini 2.0 มีความสามารถในการให้เหตุผลขั้นสูงและสิ่งเหล่านี้จะมากับ AI Overviews ใน Google Search เพื่อมอบคำตอบที่แม่นยำยิ่งขึ้นให้กับผู้ใช้สำหรับคำถามที่มีความซับซ้อนและหลายขั้นตอน

Gemini 2.0 ที่น่าจะออกเวอร์ชัน Pro ตามมาด้วยนั้น เป็นโมเดลที่ขับเคลื่อนผลิตภัณฑ์ Google Gemini ทั้งหมด รวมถึง แอปพลิเคชัน Android, แชตบอตและ Experiments ต่าง ๆ

Google ปล่อย Gemini 2.0 Flash โมเดล AI รุ่นใหม่ ทรงพลัง ไม่ต้องรอคำสั่งมนุษย์

มีอะไรใหม่ใน Gemini 2.0

Gemini 2.0 ได้รับการขนามนามจาก Google ว่าเป็น “ยุคแห่งตัวแทน” เป็นโมเดลที่มีความสามารถในการให้เหตุผลขั้นสูงคล้ายกับ o1 ของ OpenAI แต่ยังสามารถสร้างผลลัพธ์รูปภาพ คำพูด ข้อความและอื่น ๆ ได้ด้วย

โมเดลแรกในตระกูล Gemini 2.0 ที่ได้รับการปล่อยออกมา คือ Gemini 2.0 Flash แต่รุ่นปัจจุบันยังเป็นรุ่นทดลอง ซึ่ง Google ระบุว่า เร็วขึ้นเป็น 2 เท่าของ Gemini Pro 1.5 รุ่นก่อนหน้า และมีประสิทธิภาพเหนือกว่ารุ่นเดิมเกือบทั้งหมดการในการทดสอบเกณฑ์มาตรฐานสำคัญต่าง ๆ

Demis Hassabis ซีอีโอของ Google DeepMind อธิบายว่า Gemini 2.0 Flash เป็นโมเดลที่ใช้งานได้จริง โดยมีค่าเวลาแฝงที่ต่ำและมาพร้อมกับประสิทธิภาพที่ได้รับการปรับปรุง โดยสามารถสร้างสรรค์รูปภาพ ข้อความและประโยคต่าง ๆ ได้เอง จากเมื่อก่อนที่ Gemini ต้องดึงโมเดลอื่น ๆ เช่น Imagen ขึ้นมาเพื่อทำงานเหล่านั้น

นอกจากนี้ยังมีประสิทธิภาพเหนือกว่าโมเดล Gemini รุ่นก่อนหน้าทั้งหมดในด้านการให้เหตุผล เข้าใจภาพได้ดีขึ้นอย่างมาก สามารถแปลคำพูดจากเสียงได้อย่างรวดเร็ว และสามารถวิเคราะห์วิดีโอได้ดีกว่า Pro 1.5 ด้วย

Google ปล่อย Gemini 2.0 Flash โมเดล AI รุ่นใหม่ ทรงพลัง ไม่ต้องรอคำสั่งมนุษย์

“ตัวแทน” ใน Gemini 2.0 คืออะไร?

เมื่อ Gemini 1.0 เปิดตัว เราอยู่ในยุคแชตบอทของโมเดล AI ซึ่งเราสามารถพูดคุยโต้ตอบกับโมเดลเหล่านี้และออกคำสั่งให้สร้างเนื้อหาได้ จากนั้น ด้วยการมาถึงของ o1 จาก OpenAI เราก็เข้าสู่ยุคการให้เหตุผลและยุคของตัวแทนไปพร้อม ๆ กัน

“ตัวแทน” (Agents) ใน AI คือจุดที่โมเดลสามารถสร้างเวอร์ชันของตัวเองในการทำงานต่าง ๆ แทนผู้ใช้ได้ โดย Google ยังได้เปิดตัวเครื่องมือตัวแทนใหม่ใน Gemini ที่สามารถท่องเว็บแทนคุณได้ และส่งกลับมาเป็นรายงานในหัวข้อที่ซับซ้อน ซึ่งเรียกว่า “Deep Research” และรวมอยู่ใน Gemini Advanced

ซีอีโอของ Google DeepMind อธิบายว่า การใช้งานจริงของตัวแทน AI เป็นพื้นที่การวิจัยที่เต็มไปด้วยความเป็นไปได้อันน่าตื่นเต้น เรากำลังสำรวจขอบเขตใหม่นี้ด้วยต้นแบบที่สามารถช่วยผู้คนทำงานให้สำเร็จและจัดการงานต่าง ๆ ให้สำเร็จ

โครงการนี้ยังรวมถึง Project Astra ผู้ช่วยเสมือน และ Project Mariner ที่สามารถเข้าใจและให้เหตุผลกับข้อมูลในหน้าจอเบราว์เซอร์ รวมถึง Jules ตัวแทนปัญญาประดิษฐ์ช่วยนักพัฒนาแก้โค้ดต่าง ๆ

จะลองใช้ Gemini 2.0 Flash ได้ที่ไหน?

ปัจจุบัน Gemini 2.0 Flash มีให้บริการสำหรับผู้ที่สมัครสมาชิก Gemini Advanced และเบื้องต้นยังเป็นรุ่นทดลอง แต่ผู้ที่มีโอกาสได้ใช้งานแล้วบอกเป็นเสียงเดียวกันว่าใช้งานได้ดี

นอกจากนี้ ยังสามารถใช้ Gemini 2.0 Flash เป็นนักพัฒนาใน Gemini API หรือ Google Gemini AI Studio อันทรงพลังได้ ซึ่ง Google ระบุว่า จะปล่อยออกมาพร้อมกับผลิตภัณฑ์ทั้งหมดของ Google ในปี 2025