ทำความรู้จัก Xiaomo ตัวอวตาร 3 มิติ ที่ใช้ปัญญาประดิษฐ์ แปลภาษามือเป็นเสียงพูด ช่วยผู้ที่บกพร่องทางการสื่อสาร
นายแมท จาง วิศวกรด้านอัลกอริธึมของอาลีบาบา คลาวด์ ระบุว่า ปัจจุบันบริษัทพัฒนาอวตารเสมือนจริง หรือ ตัวละคร 3 มิติ ที่ใช้ปัญญาประดิษฐ์ในการขยับและออกเสียงต่าง ๆ เพื่อแปลภาษามือเป็นเสียงพูด และแปลเสียงพูดเป็นภาษามือได้อีกด้วย
ข้อมูลจากองค์การอนามัยโลก (WHO) ระบุว่าปัจจุบันผู้คนมากกว่า 1.5 พันล้านคน (เกือบ 20% ของจำนวนประชากรโลก) มีภาวะสูญเสียการได้ยิน ดังนั้นเพื่อส่งเสริมความเท่าเทียมกันในการแข่งขัน Asian Para Games ซึ่งจะจัดขึ้นระหว่างวันที่ 22 ถึง 28 ตุลาคมนี้ อาลีบาบา คลาวด์ จึงเปิดตัวอวทาร์ดิจิทัลชื่อ Xiaomo (เสี่ยวโม่) ซึ่งให้บริการเป็นล่ามภาษามือให้กับผู้บกพร่องทางการได้ยิน
Xiaomo ใช้ข้อมูลจากอาสาสมัครที่เข้ามาอัดคลิปถ่ายวิดีโอภาษามือกว่า 5,000 คน ที่สำนักงานของอาลีบาบา คลาวด์ เพื่อเป็นตัวอย่างให้ ปัญญาประดิษฐ์ นำมาวิเคราะห์ ว่า แต่ละท่าทางหมายความว่าอะไร กว่า 25,000 รายการ ซึ่งใช้เวลาพัฒนากว่า 2 ปี
อาลีบาบา คลาวด์ ใช้ประโยชน์จากอัลกอริธึมการจดจำภาพขั้นสูง และความสามารถในการติดตามกิริยาท่าทาง เพื่อบันทึกความเคลื่อนไหวของผู้บกพร่องทางการได้ยิน และแปลงภาษามือเป็นภาษาธรรมชาติ ด้วยโมเดลการแปลภาษาที่ล้ำสมัย สำหรับการแปลงภาษาธรรมชาติเป็นภาษามือ อาลีบาบา คลาวด์ได้พัฒนาโครงข่ายประสาทเทียม และโมดูลสร้างการเคลื่อนไหวของริมฝีปาก ซึ่งช่วยให้ virtual character แสดงท่าทางภาษามือได้แม่นยำ
Xiaomo ซึ่งเป็นล่ามภาษามือที่ใช้ AI ยังถูกใช้กับช่องข่าวของเอเชียนเกมส์ เพื่อให้สามารถรับทราบและเข้าถึงการประกาศข่าวต่าง ๆ ได้มากขึ้น ระหว่าง Asian Para Games ระหว่างวันที่ 22 ถึง 28 ตุลาคมนี้ อาลีบาบา คลาวด์ เชื่อว่า Xiaomo จะสามารถช่วยให้ผู้ร่วมงานที่บกพร่องทางการได้ยิน ให้สามารถปฏิสัมพันธ์กับอาสาสมัคร ณ สถานที่จัดงาน เพื่อขอความช่วยเหลือต่าง ๆ เช่น การถามเส้นทาง ความช่วยเหลือทางการแพทย์ และการรับชมเกมต่าง ๆ
อ่านเรื่องราวที่เกี่ยวข้อง