svasdssvasds

Google Lumiere คืออะไร โมเดล AI สร้างวิดีโอง่ายๆได้จากข้อความและรูปภาพ

Google Lumiere คืออะไร โมเดล AI สร้างวิดีโอง่ายๆได้จากข้อความและรูปภาพ

Google เปิดตัว Lumiere โมเดล AI ตัวใหม่ล่าสุดที่สามารถสร้างวิดีโอจากคำสั่งข้อความและรูปภาพได้ชัดแบบเฟรมต่อเฟรม ซึ่งเราจะมาดูกันว่า Lumiere ทำอะไรได้บ้าง และจะน่าสนใจแค่ไหน

Google Lumiere อีกหนึ่งโมเดลปัญญาประดิษฐ์ที่น่าสนใจในขณะนี้ ซึ่งทางกูเกิลได้โชว์ผลงานวิจัย Lumiere ที่จะสามารถสร้างคลิปวิดีโอเจ๋งๆได้จากข้อความและรูปภาพหรือที่เรียกกันว่า text-to-video และ image-to-video โดยสถาปัตยกรรม Space-Time U-Net หรือ STUNet ซึ่งแตกต่างจากโมเดล AI ที่เราเคยได้เห็นกัน

อย่างไรก็ตาม Lumiere ยังมีความสามารถอื่นๆนอกจากนี้อีกเช่น ฟีเจอร์ Text-to-Video ช่วยสร้างวิดีโอโดยการป้อนข้อความ คล้ายกับเครื่องมือ Image Creator ใน Bing ของ Microsoft นั่นเอง หรือเรียกว่าคล้ายกับฟีเจอร์ Generative AI wallpaper ในมือถือ Pixel 8 และ Pixel 8 Pro ของ Google แต่ Lumiere จะออกมาเป็นวิดีโอไม่ใช่รูปภาพ

Credit : Lumiere

ฟีเจอร์ Image-to-Video ช่วยสร้างวิดีโอโดยอาศัยรูปภาพนิ่งและข้อความ กำหนดในสิ่งที่ต้องการได้เลย และ Stylized Generation สามารถสร้างวิดีโอโดยการเลียนแบบสไตล์ศิลป์ของภาพต้นฉบับ และที่น่าสนใจคือ Video Stylization ที่สามารถเปลี่ยนสไตล์ในวิดีโอต้นฉบับให้เป็นรูปแบบที่ต้องการโดยการป้อนเป็นข้อความลงไป

Credit : Lumiere

Lumiere ยังมีอีกหลายฟีเจอร์เช่น Cinemagraphs เปลี่ยนภาพนิ่งให้เป็นภาพเคลื่อนไหวเฉพาะจุดตามที่กำหนด, Video Inpainting ที่ช่วยเติมเต็มภาพส่วนที่ขาดหายไปในวิดีโอ

Credit : Lumiere เห็นได้ว่า Google Lumiere สามารถทำอะไรได้หลากหลายมาก ซึ่งคาดว่าในอนาคต Lumiere อาจทำได้หลากหลายมากกว่าในปัจจุบันมาก ซึ่งขณะนี้สถานะการวิจัยยังคงอยู่ในการพัฒนา โดย Lumiere สามารถสร้างวิดีโอได้ความยาว 5 วินาที อัตราเฟรม 16 เฟรมต่อวินาที บนความละเอียด 128 x 128 พิกเซลเท่านั้น เราต้องมารอดูกันว่ากูเกิลจะสามารถพัฒนาโมเดล AI ตัวใหม่นี้ไปได้เร็วแค่ไหน และจะต่อสู้กับคู่แข่งโมเดล AI ตัวอื่นๆ 

ที่มา : Lumiere

 

ข่าวที่เกี่ยวข้อง : 

related