หมดปัญหาตัดต่อไม่เก่ง ถ่ายคลิปไม่สวย! Open AI เปิดตัวเครื่องมือ AI ตัวใหม่คือ Sora ใช้ AI สร้างคลิปวิดีโอสมจริงจนน่าตกใจเพียงแค่ป้อนข้อความ ซึ่งคลิปที่ได้มีความละเอียดสูงเหมือนจริง
Open AI เจ้าของ ChatGPT เปิดตัวเครื่องมือ AI ตัวใหม่คือ Sora AI สร้างวิดีโอสมจริงจนน่าตกใจ ความละเอียดสูงได้จาก text prompt เมื่อวันพฤหัสบดี โดยขณะนี้ Sora ยังให้บริการแก่นักวิจัยและครีเอทีฟจำนวนไม่มาก ซึ่งจะทดสอบโมเดลดังกล่าวก่อนที่จะเผยแพร่สู่สาธารณะ
“Sora สามารถสร้างฉากที่ซับซ้อนด้วยตัวละครหลายตัว ประเภทการเคลื่อนไหวเฉพาะ และรายละเอียดที่แม่นยำของวัตถุและพื้นหลัง แบบจำลองนี้ไม่เพียงแต่เข้าใจถึงสิ่งที่ผู้ใช้ร้องขอในทันที แต่ยังเข้าใจถึงสิ่งเหล่านั้นมีอยู่ในโลกทางกายภาพด้วย” OpenAI กล่าวในบล็อกโพสต์
ความแตกต่างของ Sora จากเครื่องมือสร้างวิดีโออื่นๆ คือ มีความสมจริงและมีความละเอียดสูง ซึ่ง Open AI บอกว่า ผู้ใช้สามารถเลือกได้ว่าต้องการวิดีโอแนว realistic หรือ animation แม้ Sora จะยังมีจุดอ่อน เช่นสร้างการเคลื่อนไหวบางอย่างที่ไม่น่าเกิดขึ้นจริงได้ และจะสับสนเมื่อต้องควบคุมสีหน้าท่าทางหลายวัตถุในวิดีโอเดียวกัน แต่พลังการเรียนรู้ของ AI ก็น่าจะสามารถแก้ไขจุดบกพร่องต่างๆได้ในไม่ช้า
Sora เป็นการลงทุนครั้งแรกของ OpenAI ในการสร้างวิดีโอ AI ต่อจาก ChatGPT และ Dall-E ซึ่งเป็นโปรแกรมสร้างข้อความและรูปภาพที่ขับเคลื่อนด้วย AI ของบริษัท มีเอกลักษณ์เฉพาะตัวเพราะมันใช้เครื่องมือในชุดคำสั่งน้อยกว่า
หากต้องการสร้างวิดีโอ ผู้ใช้แค่พิมพ์ประโยคสองสามประโยคเพื่อแจ้งความต้องการ Sora AI เปลี่ยนข้อความเป็นวิดีโอ เช่นเดียวกับโปรแกรมสร้างภาพ AI โดยสามารถเลือกระหว่างสไตล์ realistic หรือ animation ซึ่งสร้างผลลัพธ์ที่น่าตกใจในเวลาเพียงไม่กี่นาที
Sora เป็นโมเดล diffusion ซึ่งหมายความว่าจะสร้างวิดีโอโดยเริ่มจากวิดีโอที่เบลอและเป็นภาพนิ่ง แล้วค่อยๆ เรียบเรียงให้เป็นเวอร์ชันที่สวยงาม ซึ่งโมเดลรูปภาพและวิดีโอของ Midjourney และ Stable Diffusion ก็เป็นโมเดล diffusion เช่นกัน
คลิป วิดีโอที่ผลิตโดย Sora นั้นสมจริงอย่างน่าทึ่ง โดยปกติวิดีโอแบบนี้ต้องใช้เวลาหลายชั่วโมงในการผลิตโดยทีมงานภาพยนตร์หรือแอนิเมเตอร์ตัวจริง ทำให้ Sora น่าจะสร้างความเปลี่ยนแปลงให้กับอุตสาหกรรมภาพยนตร์ในลักษณะเดียวกับที่โปรแกรมสร้างภาพ ChatGPT และ AI สร้างความปั่นป่วนให้กับแวดวงวรรณกรรมและการออกแบบ
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
ตอนนี้ Sora AI ยังคงเปิดให้ใช้งานเฉพาะในกลุ่มปิด เฉพาะนักวิจัยและครีเอทีฟจำนวนไม่มาก ซึ่งจะทดสอบโมเดลดังกล่าวก่อนที่จะเผยแพร่สู่สาธารณะ และบอกด้วยว่าจะใช้มาตรฐาน C2PA metadata หรือการระบุว่าเป็นเนื้อหาจาก AI ใน Sora และจะกำหนดมาตรฐานความปลอดภัยเพื่อคอยควมคุมความเหมาะสมของ text prompt ก่อนจะถูกนำมาสร้างเป็นภาพและวิดีโอ
OpenAI ระบุว่ามีการปรับแต่งบางประการที่ต้องแก้ไข ซึ่ง Sora อาจสร้างวิดีโอคนที่กำลังกัดคุกกี้ แต่หลังจากนั้น คุกกี้ก็อาจไม่มีรอยกัด นอกจากนี้แบบจำลองนี้ยังขาดการรับรู้เชิงพื้นที่ มันอาจทำให้สับสนไปทางซ้ายและขวา และไม่เข้าใจว่าบุคคลหรือวัตถุโต้ตอบกับฉากหลังอย่างไร
นอกจากนี้ ความปลอดภัยยังเป็นข้อกังวลหลัก โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่าเทคโนโลยี AI ถูกนำไปใช้ในทางที่ผิดเพื่อสร้าง Deepfake แม้ OpenAI กล่าวว่าจะสร้างเครื่องมือเพื่อช่วยตรวจจับเนื้อหาที่ทำให้เข้าใจผิด ตลอดจนใช้เทคโนโลยีที่มีอยู่ปฏิเสธข้อความคำสั่งที่เป็นอันตราย แต่ก็ยังน่าสงสัยว่าความพยายามเหล่านี้จะประสบความสำเร็จเพียงใด
แม้จะเป็นเทคโนโลยีที่น่าสนใจแต่ก็น่ากลัวในแง่ของความมั่นคงทางอาชีพสำหรับนักสร้างสรรค์วิดีโอ และอาจก่อให้เกิดหายนะสำหรับอุตสาหกรรมภาพยนตร์ได้เช่นกัน
ที่มา
ข่าวอื่นที่น่าสนใจ