svasdssvasds

Elon Musk ชี้อนาคต AI ขาดแคลนข้อมูล ต้องเรียนรู้จาก "ข้อมูลสังเคราะห์" แทน

Elon Musk ชี้อนาคต AI ขาดแคลนข้อมูล ต้องเรียนรู้จาก "ข้อมูลสังเคราะห์" แทน

อีลอน มัสก์ มหาเศรษฐีเจ้าของบริษัทเทคโนโลยี ออกมาเปิดเผยว่า บริษัท AI ทั่วโลกกำลังประสบปัญหาขาดแคลนข้อมูลอย่างหนัก โดยข้อมูลทั้งหมดที่มนุษย์สร้างขึ้น ไม่ว่าจะเป็นข้อความ รูปภาพ หรือวิดีโอ ถูกนำไปใช้ฝึกฝนโมเดล AI จนหมดแล้ว

SHORT CUT

  • อีลอน มัสก์ เห็นว่า ข้อมูลในโลกความจริงที่ใช้ฝึก AI นั้นถูกใช้จนหมดเกลี้ยงแล้ว ต้องหันมาใช้ "ข้อมูลสังเคราะห์" ที่ AI สร้างขึ้นเอง
  • ข้อดีของ "ข้อมูลสังเคราะห์" ช่วยแก้ปัญหาการขาดแคลนข้อมูล ประหยัดต้นทุน และควบคุมคุณภาพได้ดีกว่า แต่ก็มีความเสี่ยงเรื่องข้อมูลที่ AI สร้างขึ้นเองแบบผิดๆ
  • การใช้ Synthetic Data หรือข้อมูลสังเคราะห์ ยังคงต้องระวังเรื่องความสมจริง ความหลากหลาย และอคติ รวมถึงต้องมีการจัดการข้อมูลที่ดี เพื่อให้ AI พัฒนาไปในทางที่ถูกต้อง

อีลอน มัสก์ มหาเศรษฐีเจ้าของบริษัทเทคโนโลยี ออกมาเปิดเผยว่า บริษัท AI ทั่วโลกกำลังประสบปัญหาขาดแคลนข้อมูลอย่างหนัก โดยข้อมูลทั้งหมดที่มนุษย์สร้างขึ้น ไม่ว่าจะเป็นข้อความ รูปภาพ หรือวิดีโอ ถูกนำไปใช้ฝึกฝนโมเดล AI จนหมดแล้ว

Elon Musk เสนอว่า บริษัทต่างๆ ควรหันมาใช้ "ข้อมูลสังเคราะห์" หรือข้อมูลที่ถูกสร้างขึ้นโดย AI เอง เพื่อนำมาฝึกฝนและพัฒนาโมเดล AI ซึ่งกระบวนการนี้ก็ได้เริ่มต้นขึ้นแล้วในหลายบริษัท

อีลอน มัสก์ กล่าวว่า "องค์ความรู้ทั้งหมดของมนุษย์ถูกใช้ไปจนหมดแล้วในการฝึกฝน AI มันเกิดขึ้นเมื่อปีที่แล้ว" พร้อมเสริมว่า "วิธีเดียวที่จะแก้ปัญหาการขาดแคลนข้อมูล คือการใช้ข้อมูลสังเคราะห์ ซึ่ง AI จะสร้างขึ้นมาเอง มันจะเขียนบทความ หรือนำเสนอแนวคิด จากนั้นก็จะประเมินตัวเอง และเรียนรู้ผ่านกระบวนการนี้"

CREDIT : REUTERS

ไม่ใช่แค่ Elon Musk เท่านั้นที่มองเห็นศักยภาพของ "ข้อมูลสังเคราะห์" ปัจจุบันบริษัทเทคโนโลยียักษ์ใหญ่หลายแห่ง เช่น Microsoft, Meta, OpenAI และ Anthropic ต่างก็เริ่มนำ "ข้อมูลสังเคราะห์" มาใช้ฝึกฝน AI ของตัวเองแล้วเช่นกัน

Gartner คาดการณ์ว่า 60% ของข้อมูลที่ใช้สำหรับ AI และงานวิเคราะห์ในปี 2024 จะเป็น "ข้อมูลสังเคราะห์" ซึ่งสะท้อนให้เห็นถึงแนวโน้มการเติบโตอย่างรวดเร็วของเทคโนโลยีนี้

Elon Musk ชี้อนาคต AI ขาดแคลนข้อมูล ต้องเรียนรู้จาก \"ข้อมูลสังเคราะห์\" แทน

การสร้าง "ข้อมูลสังเคราะห์ (Synthetic Data)" มีต้นทุนที่ต่ำกว่าการเก็บรวบรวมข้อมูลจริงมาก

บริษัท Writer รายงานว่า โมเดล Palmyra X 004 ซึ่งพัฒนาโดยใช้ "ข้อมูลสังเคราะห์" เกือบทั้งหมด มีค่าใช้จ่ายในการพัฒนาเพียง 700,000 ดอลลาร์ เทียบกับโมเดล OpenAI ที่มีขนาดใกล้เคียงกันซึ่งมีค่าใช้จ่ายสูงถึง 4.6 ล้านดอลลาร์

Elon Musk ชี้อนาคต AI ขาดแคลนข้อมูล ต้องเรียนรู้จาก \"ข้อมูลสังเคราะห์\" แทน

อย่างไรก็ตาม Elon Musk เตือนว่า การใช้ "ข้อมูลสังเคราะห์" ก็มีความเสี่ยงเช่นกัน โดยเฉพาะอย่างยิ่งปัญหา "ภาพหลอน" (Hallucination) หรือการที่ AI สร้างข้อมูลที่ไม่ถูกต้อง หรือไร้สาระ ซึ่งอาจส่งผลต่อคุณภาพของโมเดล AI

ข้อมูล (Data) โดยเฉพาะอย่างยิ่งข้อมูลที่มีคุณภาพสูง กำลังกลายเป็นสมรภูมิสำคัญในยุค AI

OpenAI ยอมรับว่า การสร้างเครื่องมืออย่าง ChatGPT จำเป็นต้องใช้ข้อมูลที่มีลิขสิทธิ์ ขณะที่อุตสาหกรรมสร้างสรรค์ และสำนักพิมพ์ต่างๆ กำลังเรียกร้องค่าตอบแทนจากการที่ผลงานของพวกเขาถูกนำไปใช้ฝึกฝน AI

ที่มา : The GuardianTechcrunch , observer

related