อาลีบาบา คลาวด์ เปิดตัวโมเดล AI ใหม่ ล้ำจัด แปลงข้อความเป็นวิดีโอ ได้

19 Sep 2024

อาลีบาบา คลาวด์ Alibaba Cloud เปิดตัว เปิดตัว Open-sourced Qwen 2.5 Multimodal 100 โมเดล และเปิดตัวโมเดล AI แปลงข้อความเป็นวิดีโอ (Text-to-Video AI Model) ใหม่ เพื่อยกระดับงานการสร้างสรรค์รูปภาพ และ มอบคุณประโยชน์สูงสุดให้กับลูกค้าด้วยโครงสร้างพื้นฐานคลาวด์ที่ปรับโฉมใหม่

SHORT CUT

เปิดตัว Alibaba Cloud Open-sourced #Qwen2.5 Multimodal 100 โมเดล และเปิดตัวโมเดล AI แปลงข้อความเป็นวิดีโอ (Text-to-Video AI Model) ใหม่ เพื่อยกระดับงานการสร้างสรรค์รูปภาพ

โมเดล AI ใหม่ ตัวนี้ มอบคุณประโยชน์สูงสุดให้กับลูกค้าด้วยโครงสร้างพื้นฐานคลาวด์ที่ปรับโฉมใหม่

ปัจจุบัน ยอดดาวน์โหลดโมเดลต่าง ๆ ของ Owen ทะลุ 40 ล้านครั้ง จากทุกแพลตฟอร์ม

อาลีบาบา คลาวด์ Alibaba Cloud เปิดตัว เปิดตัว Open-sourced Qwen 2.5 Multimodal 100 โมเดล และเปิดตัวโมเดล AI แปลงข้อความเป็นวิดีโอ (Text-to-Video AI Model) ใหม่ เพื่อยกระดับงานการสร้างสรรค์รูปภาพ และ มอบคุณประโยชน์สูงสุดให้กับลูกค้าด้วยโครงสร้างพื้นฐานคลาวด์ที่ปรับโฉมใหม่

อาลีบาบา คลาวด์ ประกาศ ณ งาน Apsara Conference ซึ่งเป็นงานประชุมประจำปีครั้งสำคัญของบริษัทฯ Alibaba Cloud ว่าได้นำเสนอ Owen 2.5 ซึ่งเป็นโมเดลด้านภาษาขนาดใหญ่ของบริษัทฯ ที่เพิ่งเปิดตัวล่าสุด มากกว่า 100 โมเดลให้กับชุมชนโอเพ่นซอร์สทั่วโลก

นอกจากนี้ อาลีบาบา คลาวด์ ยังได้เปิดตัวโครงสร้างพื้นฐานที่จำเป็นต่อการสร้าง ทดสอบ และการใช้งานแอปฯ ต่างๆ (full-stack infrastructure) ที่ออกแบบมาเพื่อให้ตอบโจทย์ความต้องการการประมวลผลที่ทรงพลังเพื่อใช้กับ AI ที่เพิ่มมากขึ้น โดยโครงสร้างพื้นฐานใหม่นี้ประกอบด้วยผลิตภัณฑ์และบริการคลาวด์ล้ำหน้า ที่ช่วยให้การประมวลผล เครือข่าย และสถาปัตยกรรมศูนย์ข้อมูลมีประสิทธิภาพสูงขึ้น โดยมีจุดหมายเพื่อสนับสนุนการพัฒนาที่ประสบความสำเร็จอย่างงดงาม และการใช้โมเดล AI ต่าง ๆ ได้ในวงกว้าง

เอ็ดดี้ วู ประธานและซีอีโอของอาลีบาบา คลาวด์ อินเทลลิเจนซ์ บอกว่าบริษัท มุ่งมั่นสร้างโครงสร้างพื้นฐาน AI แห่งอนาคต เพื่อให้บริการลูกค้าทั่วโลก

"อาลีบาบา คลาวด์ ลงทุนด้านการวิจัยและพัฒนาเทคโนโลยี AI และการสร้างโครงสร้างพื้นฐานระดับโลกของบริษัทฯ อย่างจริงจังในครั้งนี้ ด้วยเรามุ่งมั่นสร้างโครงสร้างพื้นฐาน AI แห่งอนาคต เพื่อให้บริการลูกค้าทั่วโลก และให้ลูกค้าของเราได้พบกับโอกาสทางธุรกิจอย่างไม่มีข้อจำกัด"

จิงเหริน โซว ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของอาลีบาบา คลาวด์ อินเทลลิเจนซ์ เปิดตัวโมเดล open-sourced Qwen2.5 ใหม่ ณ งาน Apsara Conference 2024

โมเดลโอเพ่นซอร์ส 100 โมเดล

โมเดลโอเพ่นซอร์ส ต่าง ๆ ของ Owen 2.5 ที่เพิ่งเปิดตัวใหม่ มีพารามิเตอร์ตั้งแต่ขนาด 0.5 ถึง 72 พันล้านพารามิเตอร์ มีความรอบรู้มากขึ้น มีความสามารถด้านคณิตศาสตร์และการเขียนโค้ดอย่างมาก สามารถรองรับได้มากกว่า 29 ภาษา รองรับการใช้ AI ได้หลากหลายทั้งการใช้งานที่ edge หรือบนคลาวด์ ในทุกแวดวง ไม่ว่าจะเป็นวงการยานยนต์ วงการเกม ไปจนถึงการวิจัยทางวิทยาศาสตร์

ซีรีส์โมเดล Owen ซึ่งเป็นพอร์ตโฟลิโอของโมเดลภาษาขนาดใหญ่ที่เป็นเอกสิทธิ์ของอาลีบาบา คลาวด์ ประสบความสำเร็จอย่างงดงามตั้งแต่เปิดตัวครั้งแรกเมื่อเดือนเมษายน 2566

โดย ปัจจุบัน ยอดดาวน์โหลดโมเดลต่าง ๆ ของ Owen ทะลุ 40 ล้านครั้ง จากทุกแพลตฟอร์ม เช่น Hugging Face และ ModelScope ซึ่งเป็นชุมชนโอเพ่นซอร์สที่ตั้งขึ้นโดยอาลีบาบา ยิ่งไปกว่านั้นโมเดลเหล่านี้ยังเป็นแรงกระตุ้นให้เกิดการสร้างสรรค์โมเดลต่าง ๆ มากกว่า 50,000 รายการบน Hugging Face

Owen 2.5 จะโอเพ่นซอร์สโมเดลมากกว่า 100 รายการ กลุ่มผลิตภัณฑ์นี้ประกอบด้วย

โมเดลพื้นฐาน (base models)
โมเดลคำสั่ง (instruct models)
และโมเดลเชิงปริมาณ (quantized models) ที่มีระดับความแม่นยำและวิธีการหลากหลาย ครอบคลุมการใช้งานรูปแบบต่าง ๆ เช่น ภาษา เสียง และ ภาพ พร้อมด้วยโค้ดเฉพาะทางและโมเดลทางคณิตศาสตร์ต่างๆ

Qwen2.5-Max แสดงให้เห็นถึงความทรงประสิทธิภาพในงานด้านต่าง ๆ เช่น คณิตศาสตร์และการเขียนโค้ด เมื่อเทียบกับโมเดลล้ำสมัยรุ่นอื่น ๆ

การสร้างสรรค์ด้านโอเพ่นซอร์สที่กว้างขวางมากที่สุด

ทั้งนี้ จิงเหริน โซว ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของอาลีบาบา คลาวด์ อินเทลลิเจนซ์ แสดงความเห็นว่า นี่จะเป็นอีกก้าวที่สร้างสรรค์ด้านโอเพ่นซอร์สที่กว้างขวางมากที่สุดเท่าที่เคยมีมา

"นับเป็นก้าวสำคัญของเราที่ได้เปิดตัวสิ่งที่เป็นการสร้างสรรค์ด้านโอเพ่นซอร์สที่กว้างขวางมากที่สุดเท่าที่เคยมีมา โดยมีจุดมุ่งหมายเพื่อเสริมศักยภาพให้กับนักพัฒนาซอฟต์แวร์และองค์กรทุกขนาด ให้สามารถใช้ประโยชน์จากเทคโนโลยี AI ได้มากขึ้น และกระตุ้นการเติบโตให้กับชุมชนโอเพ่นซอร์ส เรายังคงให้คำมั่นที่จะลงทุนด้านโครงสร้างพื้นฐาน AI ที่ล้ำหน้า เพื่อส่งเสริมให้อุตสาหกรรมหลากหลายสามารถนำเทคโนโลยี generative AI ไปใช้ได้อย่างกว้างขวาง"

อัปเกรด Qwen-Max ให้เข้าใจการใช้เหตุผล

นอกจากนี้ อาลีบาบา คลาวด์ ยังได้ประกาศว่าได้อัปเกรด Qwen-Max ซึ่งเป็นโมเดลเรือธงที่บริษัทฯ เป็นเจ้าของ โมเดล Qwen-Max ที่ได้รับการเพิ่มประสิทธิภาพ แสดงให้เห็นถึงประสิทธิภาพที่ทัดเทียมกันกับโมเดลที่ล้ำสมัยอื่น ๆ ในด้านต่าง ๆ เช่น ความเข้าใจภาษาและการใช้เหตุผล คณิตศาสตร์ และการเขียนโค้ด

ขยายขอบเขตความสามารถหลายรูปแบบแปลงข้อความเป็นวิดีโอ text-to-video

นอกจากชุดโมเดลภาษาขนาดใหญ่ที่แพร่หลายแล้ว อาลีบาบา คลาวด์ ยังได้เปิดตัวโมเดลที่สามารถแปลงข้อความเป็นวิดีโอ (text-to-video) ใหม่ ให้เป็นส่วนหนึ่งของโมเดลการสร้างรูปภาพในตระกูลทงอี้ ว่านเซี่ยง (Tongyi Wanxiang) โมเดลใหม่นี้สามารถสร้างวิดีโอคุณภาพสูงในรูปแบบที่หลากหลาย ไม่ว่าจะเป็นฉากสมจริง ไปจนถึงภาพเคลื่อนไหว 3 มิติ (3D animation) ทั้งยังสามารถสร้างวิดีโอจากคำสั่งที่เป็นข้อความภาษาจีนและภาษาอังกฤษ และแปลงภาพนิ่งเป็นวิดีโอที่มีการเคลื่อนไหว โมเดลนี้มีสถาปัตยกรรม diffusion transformer (DiT) ขั้นสูงเพื่อเพิ่มคุณภาพให้กับการสร้างวิดีโอใหม่

บริษัทฯ ยังกำลังทำการอัปเดตโมเดลภาษาภาพ (vision language model) ครั้งสำคัญ ด้วยการเปิดตัว Owen2-VL ซึ่งสามารถเข้าใจวิดีโอที่มีความยาวมากกว่า 20 นาที และสามารถตอบคำถามผ่านวิดีโอได้ Owen2-VL มาพร้อมความสามารถในการใช้เหตุผลและการตัดสินใจที่ซับซ้อน ได้รับการออกแบบมาสำหรับใช้ได้ทั้งกับโทรศัพท์มือถือ ยานยนต์ และ หุ่นยนต์ ช่วยให้การทำงานเฉพาะทางเป็นไปโดยอัตโนมัติ

อาลีบาบา คลาวด์ ยังได้เปิดตัว AI Developer ซึ่งเป็นผู้ช่วยด้าน AI ที่มี Qwen เป็นเทคโนโลยีหลักอยู่เบื้องหลัง ออกแบบมาสำหรับการเขียนโปรแกรม โดยสนับสนุนการทำงานแบบอัตโนมัติให้กับโปรแกรมเมอร์ เช่น การวิเคราะห์ความต้องการ การเขียนโปรแกรมโค้ด การระบุจุดบกพร่องของซอฟต์แวร์และทำการแก้ไข ความสามารถเหล่านี้ช่วยเพิ่มทักษะให้นักพัฒนา และช่วยให้มุ่งความสนใจกับงานสำคัญอื่น ๆ ได้มากขึ้น

การอัปเกรดโครงสร้างพื้นฐาน AI แบบฟูลสแตก

อาลีบาบา คลาวด์ ยังได้ประกาศการอัปเดตใหม่ ๆ จำนวนมากให้กับโครงสร้างพื้นฐาน AI แบบฟลูแสตก ครอบคลุมถึง สถาปัตยกรรมดาต้าเซ็นเตอร์ที่เป็นมิตรต่อสิ่งแวดล้อม การบริหารจัดการข้อมูล การเทรนและการอนุมานโมเดล ดังนี้

●   สถาปัตยกรรมดาต้าเซ็นเตอร์ยุคใหม่รองรับความต้องการการพัฒนา AI ที่กำลังพุ่งสูงขึ้น
●   AI Scheduler พร้อมการเทรนและอนุมานโมเดลแบบองค์รวม
●   DMS สำหรับการบริหารจัดการเมตาดาต้าแบบองค์รวม
●   บริการการประมวลผลแบบยืดหยุ่นที่มีประสิทธิภาพมากขึ้น

การอัปเดตเหล่านี้ได้รับการออกแบบมาเพื่อให้การสนับสนุนที่ครบวงจรแก่ลูกค้าและพันธมิตร เพื่อให้ลูกค้าและพันธมิตรได้รับประโยชน์สูงสุดจากเทคโนโลยีล่าสุดที่ใช้ในการสร้างแอปพลิเคชัน AI ทรงประสิทธิภาพ อย่างยั่งยืน และครอบคลุมมากขึ้น

ข่าวที่เกี่ยวข้อง