SHORT CUT
อีลอน มัสก์ มหาเศรษฐีเจ้าของบริษัทเทคโนโลยี ออกมาเปิดเผยว่า บริษัท AI ทั่วโลกกำลังประสบปัญหาขาดแคลนข้อมูลอย่างหนัก โดยข้อมูลทั้งหมดที่มนุษย์สร้างขึ้น ไม่ว่าจะเป็นข้อความ รูปภาพ หรือวิดีโอ ถูกนำไปใช้ฝึกฝนโมเดล AI จนหมดแล้ว
Elon Musk เสนอว่า บริษัทต่างๆ ควรหันมาใช้ "ข้อมูลสังเคราะห์" หรือข้อมูลที่ถูกสร้างขึ้นโดย AI เอง เพื่อนำมาฝึกฝนและพัฒนาโมเดล AI ซึ่งกระบวนการนี้ก็ได้เริ่มต้นขึ้นแล้วในหลายบริษัท
Watch Stagwell's CEO Mark Penn interview Elon Musk at CES! https://t.co/BO3Z7bbHOZ
— Live (@Live) January 9, 2025
อีลอน มัสก์ กล่าวว่า "องค์ความรู้ทั้งหมดของมนุษย์ถูกใช้ไปจนหมดแล้วในการฝึกฝน AI มันเกิดขึ้นเมื่อปีที่แล้ว" พร้อมเสริมว่า "วิธีเดียวที่จะแก้ปัญหาการขาดแคลนข้อมูล คือการใช้ข้อมูลสังเคราะห์ ซึ่ง AI จะสร้างขึ้นมาเอง มันจะเขียนบทความ หรือนำเสนอแนวคิด จากนั้นก็จะประเมินตัวเอง และเรียนรู้ผ่านกระบวนการนี้"
ไม่ใช่แค่ Elon Musk เท่านั้นที่มองเห็นศักยภาพของ "ข้อมูลสังเคราะห์" ปัจจุบันบริษัทเทคโนโลยียักษ์ใหญ่หลายแห่ง เช่น Microsoft, Meta, OpenAI และ Anthropic ต่างก็เริ่มนำ "ข้อมูลสังเคราะห์" มาใช้ฝึกฝน AI ของตัวเองแล้วเช่นกัน
Gartner คาดการณ์ว่า 60% ของข้อมูลที่ใช้สำหรับ AI และงานวิเคราะห์ในปี 2024 จะเป็น "ข้อมูลสังเคราะห์" ซึ่งสะท้อนให้เห็นถึงแนวโน้มการเติบโตอย่างรวดเร็วของเทคโนโลยีนี้
การสร้าง "ข้อมูลสังเคราะห์ (Synthetic Data)" มีต้นทุนที่ต่ำกว่าการเก็บรวบรวมข้อมูลจริงมาก
บริษัท Writer รายงานว่า โมเดล Palmyra X 004 ซึ่งพัฒนาโดยใช้ "ข้อมูลสังเคราะห์" เกือบทั้งหมด มีค่าใช้จ่ายในการพัฒนาเพียง 700,000 ดอลลาร์ เทียบกับโมเดล OpenAI ที่มีขนาดใกล้เคียงกันซึ่งมีค่าใช้จ่ายสูงถึง 4.6 ล้านดอลลาร์
อย่างไรก็ตาม Elon Musk เตือนว่า การใช้ "ข้อมูลสังเคราะห์" ก็มีความเสี่ยงเช่นกัน โดยเฉพาะอย่างยิ่งปัญหา "ภาพหลอน" (Hallucination) หรือการที่ AI สร้างข้อมูลที่ไม่ถูกต้อง หรือไร้สาระ ซึ่งอาจส่งผลต่อคุณภาพของโมเดล AI
ข้อมูล (Data) โดยเฉพาะอย่างยิ่งข้อมูลที่มีคุณภาพสูง กำลังกลายเป็นสมรภูมิสำคัญในยุค AI
OpenAI ยอมรับว่า การสร้างเครื่องมืออย่าง ChatGPT จำเป็นต้องใช้ข้อมูลที่มีลิขสิทธิ์ ขณะที่อุตสาหกรรมสร้างสรรค์ และสำนักพิมพ์ต่างๆ กำลังเรียกร้องค่าตอบแทนจากการที่ผลงานของพวกเขาถูกนำไปใช้ฝึกฝน AI
ที่มา : The Guardian, Techcrunch , observer