DeepSeek เปิดตัวโมเดล AI รองรับสื่อผสมผสานหรือ Multimodal ชื่อว่า Janus-Pro มีขนาดพารามิเตอร์ 1B และ 7B พร้อมความสามารถในการวิเคราะห์และสร้างรูปภาพขึ้นใหม่ตามที่กำหนดได้
ความสามารถของ โมเดล AI วิเคราะห์และสร้างรูป จาก DeepSeek
AI Janus Pro มาพร้อมความสามารถ อาทิ
• การสร้างรูปภาพจากคำอธิบาย (Text-to-image)
• การวิเคราะห์ภาพ (Computer Vision) ที่สามารถอธิบายเนื้อหาในภาพหรือตอบคำถามเกี่ยวกับสิ่งที่โมเดลเห็นได้
โดยทีมพัฒนาได้ใช้เทคนิค “Novel Autoregressive Framework” ที่รวมการประมวลผลข้อมูลหลายรูปแบบเข้าด้วยกัน ช่วยเพิ่มประสิทธิภาพและความยืดหยุ่นในการทำงาน
โดย Janus-Pro มีประสิทธิภาพเหนือกว่าโมเดลสร้างภาพชั้นนำอย่าง DALL-E 3 และ Stable Diffusion โดยการเปิดตัวนี้เกิดขึ้นหลังจากที่บริษัทเปิดตัว R1 ที่สร้างกระแสอย่างมาก
จากผลการทดสอบด้วยชุดทดสอบ GenEval และ DPG-Bench พบว่า Janus-Pro-7B ทำคะแนนได้สูงกว่า DALL-E 3 ของ OpenAI ตลอดจนโมเดลสร้างรูปภาพอื่นอย่าง PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ของ Stability AI
โมเดลสามารถดาวน์โหลดได้ที่ GitHub ภายใต้เงื่อนไขใช้งาน MIT จึงสามารถใช้งานในเชิงพาณิชย์ได้