ไมโครซอฟท์ VASA-1 เปลี่ยนภาพใบเดียวให้กลายเป็นวิดีโอ ล้ำแบบเรียลไทม์ มีการขยับอย่างเป็นธรรมชาติมากขึ้น เนียนขึ้นอย่างเห็นได้ชัด
ทุกวันเรื่องของเทคโนโลยีล้ำ และ ทันสมัยมากขึ้นเรื่อยๆ และการเปลี่ยนแปลงเดินเร็วขึ้นเรื่อยๆ รวมถึง การใช้ AI ตัวใหม่ๆก็มีความ สุด ความล้ำ และสมจริง , ให้เราได้ว้าวมากขึ้นเรื่อยๆ โดยล่าสุด การสร้างวิดีโอจากภาพนิ่งด้วยใบเดียว ได้เกิดขึ้นแล้ว และความเนียน ความสมจริงของวิดีโอที่เกิดขึ้นก็ดี มีคุณภาพดีขึ้น และพัฒนามากขึ้นเรื่อยๆ โดยล่าสุด Microsoft Research เผยแพร่งานวิจัย VASA-1 โมเดล AI สำหรับสร้างวิดีโอใบหน้าที่กำลังพูดข้อความที่กำหนด ซึ่งมีการขยับอย่างเป็นธรรมชาติมากขึ้น เนียนขึ้นอย่างเห็นได้ชัด
โดยวิดีโอที่พัฒนานี้ เป็นการใช้ AI และเพียงแค่เติมรูปภาพนิ่งใบหน้าแค่ 1 รูป และไฟล์เสียง เท่านั้น ก็สามารถสร้างคลิปวิดีโอจาก AI ได้แล้ว
จุดเด่นของโมเดล AI นี้คือการทำงานได้แบบเรียลไทม์ ขนาดของใบหน้าในคลิปวิดีโอก็มีการแตกต่างในไซส์ต่างๆ และความเนียนของวิดีโอก็คือ ในจังหวะกะพริบตานั้นก็ลงตัวมากขึ้น
ทั้งนี้ โมเดล VASA-1 สามารถสร้างวิดีโอความละเอียด 512x512 45fps ได้หาก รันออฟไลน์แบบ batch ส่วนแบบออนไลน์สตรีมมิ่งได้สูงสุดที่ 40fps
VASA-1 รองรับการใส่อินพุทเพิ่มเติมคือสัญญาณลักษณะที่ต้องการ เช่น ตำแหน่งดวงตา, การขยับใบหน้า , เปลี่ยนมุมกล้อง , รวมถึงการแสดงออกทางสีหน้าและอารมณ์
ก่อนหน้านี้ เคยมี AI สร้างเสียงเลียนแบบจาก OpenAI คราวนี้มาเป็นคลิปใบหน้าแถมทำงานได้เรียลไทม์ ไมโครซอฟท์ Microsoft จึงให้ข้อมูลเพิ่มเติมว่า ปัจจุบันคลิปที่สร้างออกมาด้วย VASA นั้น ยังมีจุดสังเกตได้ว่าเป็นวิดีโอ AI แตกต่างจากวิดีโอของจริง
อย่างไรก็ตามเมื่อประเมินจากความเสี่ยงที่จะนำตัวซอฟท์แวร์ ของการนำไปใช้ในทางที่ไม่เหมาะสมแล้ว ไมโครซอฟท์จึงไม่มีแผนในการนำเสนอทั้งเดโม่, เผยแพร่ API หรือข้อมูลอื่นเพิ่มเติมของเทคโนโลยีนี้ จนกว่าจะมีแนวทางควบคุมการใช้งานอย่างเหมาะสม ซึ่งรวมทั้งกฎหมายกำกับดูแลด้วย
ในช่วงปี 2024 ที่เป็นปีที่ AI มีการพัฒนาไปอย่างรวดเร็วมาก , โดยช่วงต้นปี Google ก็เพิ่ง เปิดตัว AI ลูเมียร์ ที่มีความสามารถ แปลงข้อความ-รูปภาพให้เป็นวิดีโอที่สมจริงได้ในระยะเวลาอันรวดเร็ว
ที่มา : microsoft
ข่าวที่เกี่ยวข้อง