DeepSeek เปิดตัว Janus-Pro โมเดล AI วิเคราะห์และสร้างรูปภาพรุ่นใหม่

DeepSeek เปิดตัวโมเดล AI รองรับสื่อผสมผสานหรือ Multimodal ชื่อว่า Janus-Pro มีขนาดพารามิเตอร์ 1B และ 7B พร้อมความสามารถในการวิเคราะห์และสร้างรูปภาพขึ้นใหม่ตามที่กำหนดได้

ความสามารถของ โมเดล AI วิเคราะห์และสร้างรูป จาก DeepSeek

AI Janus Pro มาพร้อมความสามารถ อาทิ

• การสร้างรูปภาพจากคำอธิบาย (Text-to-image)
• การวิเคราะห์ภาพ (Computer Vision) ที่สามารถอธิบายเนื้อหาในภาพหรือตอบคำถามเกี่ยวกับสิ่งที่โมเดลเห็นได้

โดยทีมพัฒนาได้ใช้เทคนิค “Novel Autoregressive Framework” ที่รวมการประมวลผลข้อมูลหลายรูปแบบเข้าด้วยกัน ช่วยเพิ่มประสิทธิภาพและความยืดหยุ่นในการทำงาน

ประสิทธิภาพ Janus-Pro เป็นอย่างไร ?

โดย Janus-Pro มีประสิทธิภาพเหนือกว่าโมเดลสร้างภาพชั้นนำอย่าง DALL-E 3 และ Stable Diffusion โดยการเปิดตัวนี้เกิดขึ้นหลังจากที่บริษัทเปิดตัว R1 ที่สร้างกระแสอย่างมาก

จากผลการทดสอบด้วยชุดทดสอบ GenEval และ DPG-Bench พบว่า Janus-Pro-7B ทำคะแนนได้สูงกว่า DALL-E 3 ของ OpenAI ตลอดจนโมเดลสร้างรูปภาพอื่นอย่าง PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ของ Stability AI

โมเดลสามารถดาวน์โหลดได้ที่ GitHub ภายใต้เงื่อนไขใช้งาน MIT จึงสามารถใช้งานในเชิงพาณิชย์ได้

DeepSeek เปิดตัว Janus-Pro โมเดล AI วิเคราะห์และสร้างรูปภาพรุ่นใหม่