การทำงานด้านข้อมูล ที่ต้องใช้เอกสารเยอะ ๆ เช่น การทำแบบสอบถาม งานวิจัย ความลำบากในการทำสิ่งนี้คือ ทุกครั้งที่ได้กระดาษคำตอบหรือข้อมูลเหล่านี้มา ต้องคอยพิมพ์ข้อความทีล่ะแผ่น เพื่อจัดเก็บข้อมูลเป็นไฟล์ดิจิทัล เสียทั้งเวลา สายตา และสุขภาพ
โดย อาจารย์คณะวิศวฯ จุฬาฯ ได้มีการ นำเทคโนโลยี AI Deep Tech มาพัฒนาโปรแกรมสแกนเอกสารและรูปภาพเป็นข้อความ (OCR) อ่านภาษาไทยแม่นยำกว่า 90%
รองศาสตราจารย์ ดร.ธนารัตน์ ชลิดาพงศ์ อาจารย์จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย นำทีมนิสิตปริญญาเอก ดร.ธนานพ กอบชัยสวัสดิ์ ร่วมพัฒนา "ReadMe" โปรแกรมประเภท OCR (Optical Character Recognition) เพื่อช่วยสแกนข้อความทั้งภาษาไทยและภาษาอังกฤษที่อยู่บนเอกสาร รูปภาพ หรือไฟล์วีดิโอ ให้ออกมาเป็นตัวหนังสือดิจิทัลได้ทันที
เนื้อหาที่น่าสนใจ
เทคโนโลยี OCR หรือ Optical Character Recognition
คือ โปรแกรมที่ใช้สแกนตัวหนังสือจากภาพ หรือวีดิโอ ให้กลายเป็นตัวหนังสือแบบดิจิทัล ใช้งานได้ทันที ซึ่งรูปภาพที่นำมาใช้สแกนนั้นเป็นได้ 2 ลักษณะ คือ รูปภาพทั่วไป (Scene text image) และรูปภาพที่เป็นเอกสาร (Document scanned image) โดยจุดอ่อนของ เทคโนโลยี OCR ที่เป็นอุปสรรคของคนไทย ซึ่งก็คือการอ่าน "ภาษาไทย" นั่นเอง เพราะตัวอักขระเยอะ มีสระ มีวรรณยุกต์ ในหนึ่งบรรทัดมีตัวอักษรได้ถึง 4 ระดับ ในขณะที่ภาษาอังกฤษมีเพียงระดับเดียว
โดย ReadMe ได้แก้ไข จุดอ่อนข้อนี้ไป โดยการนำ เทคโนโลยีการเรียนรู้เชิงลึก (Deep Learning) เข้ามาช่วยเพิ่มความแม่นยำให้เทคโนโลยี OCR อ่านภาษาไทยได้เก่งเหมือนมีคนไทยมาอ่านเอง ซึ่งองค์กรที่นำ ReadMe ไปใช้ในระบบแล้ว พบว่า เมื่อเทียบกับ OCR ของอื่นๆ ทั้งของไทยและต่างประเทศ ReadMe มีความแม่นยำมากที่สุดถึง 92.6% ช่วยลดความผิดพลาดได้มากขึ้น
ReadMe เป็นผลิตภัณฑ์ ของบริษัท Eikonnex AI จำกัด ภายใต้การสนับสนุนจากศูนย์วิจัยและพัฒนาเทคโนโลยีเพื่ออุตสาหกรรม จุฬาลงกรณ์มหาวิทยาลัย (Chula UTC) ที่ รศ.ดร.ธนารัตน์ พัฒนาขึ้นหลังจากสำรวจปัญหาในภาคธุรกิจ งานของภาคธุรกิจส่วนใหญ่เป็นงานเอกสาร
สามารถดูรายละเอียด ReadMe เพิ่มเติมได้ทางเว็บไซต์ https://www.eikonnex.ai/ และเข้าไปทดลองใช้ ReadMe เวอร์ชันทดลองได้ที่ https://readme.eikonnex.ai/