Dalam obrolan langsung dengan presiden Stagwell, Mark Penn pekan lalu, Elon Musk menjelaskan bahwa industri kecerdasan buatan (AI) menghadapi kekurangan data nyata untuk melatih model AI-nya. Musk mengatakan bahwa metode pelatihan AI tradisional tidak lagi efektif, dan mengusulkan peralihan ke penggunaan data sintetis.
Menurut Musk, penggunaan data sintetis merupakan arah baru bagi industri AI, di mana data dihasilkan oleh model AI itu sendiri. Ia yakin hal ini akan membantu AI mengevaluasi dirinya sendiri dan belajar dari proses pembelajarannya. Perusahaan teknologi besar seperti Microsoft, Meta, OpenAI, dan Anthropic kini menggunakan data sintetis untuk melatih model AI terkemuka.
Namun, penggunaan data agregat juga menimbulkan banyak risiko, seperti membuat model menjadi kurang kreatif dan bias dalam keluarannya. Elon Musk telah memperingatkan bahwa kehabisan data dalam pelatihan AI bukan hanya masalah saat ini tetapi juga berdampak pada masa depan industri AI. Kegagalan untuk segera mengatasi masalah kekurangan data dapat mengancam pengembangan AI dan penerapannya di dunia nyata.
Dalam obrolan langsung dengan presiden Stagwell Mark Penn minggu lalu, Elon Musk telah menegaskan bahwa industri kecerdasan buatan (SIAPA) menghadapi masalah serius: data nyata untuk melatih model AI hampir habis. Menurut Musk, mulai saat ini, metode tradisional masuk pelatihan AI tidak lagi efektif, dan industri perlu beralih ke solusi baru, seperti menciptakan solusi sendiri data agregat.
Musk menekankan bahwa kita telah “hampir kehabisan pengetahuan manusia” dalam hal pelatihan AI, dan dia mengaitkan hal ini dengan hal ini terjadi pada tahun lalu. Pengamatan tersebut diperkuat oleh Ilya Sutskever, mantan chief saintifik OpenAI, dalam pidatonya di konferensi NeurIPS, di mana ia menyatakan bahwa industri AI telah mencapai “data puncak”. Sutskever juga melakukannya peringatan bahwa kekurangan data pelatihan akan memerlukan perubahan dalam cara model dikembangkan.
Menurut Musk, salah satu arah yang mungkin bagi industri ini adalah produksi data sintetis, yaitu data yang dihasilkan oleh model AI itu sendiri. Dia menjelaskan bahwa, “Satu-satunya cara untuk melengkapi data nyata adalah dengan menggunakan data sintetis, di mana AI menghasilkan data pelatihan.” Ia yakin berkat kumpulan data, AI akan mampu melakukannya sendiri Mengevaluasi dan menarik pelajaran dari proses belajar Anda sendiri.
Banyak perusahaan teknologi besar seperti Microsoft, Meta, OpenAI, dan Anthropic sudah menggunakan data sintetis untuk melatih model AI terkemuka. Sebuah studi dari Gartner menunjukkan bahwa sekitar 60% data yang digunakan untuk proyek AI dan analitik pada tahun 2024 akan dikumpulkan.
Biasanya, Microsoft membuka kode sumber untuk model Phi-4 awal pekan ini, yang dilatih dari data nyata dan sintetis. Demikian pula, model Gemma Google juga menggunakan data gabungan. Anthropic juga menerapkan beberapa data sintetis untuk mengembangkan sistem Soneta Claude 3.5. Meta juga telah menyempurnakan model Llama seri terbaru dengan data yang dihasilkan oleh AI.
Menggunakan data agregat tidak hanya membantu mengatasi kekurangan data namun juga memberikan keuntungan biaya. Penulis Startup AI mengatakan Palmyra
Namun, penggunaan data agregat juga menimbulkan banyak risiko. Beberapa penelitian menunjukkan bahwa data yang dikumpulkan dapat menyebabkan degradasi model, yaitu model menjadi kurang “kreatif” dan lebih bias dalam keluarannya, yang pada akhirnya dapat menurunkan kinerja model secara serius. Jika data yang digunakan untuk melatih model ini memiliki bias dan keterbatasan, produk AI juga akan memiliki kekurangan tersebut.
Bagaimanapun, Elon Musk berbicara tentang kehabisan data dalam pelatihan AI bukan hanya sebuah sinyal tentang situasi saat ini tetapi juga peringatan untuk masa depan industri ini. Jika tidak segera disesuaikan, kurangnya data nyata dapat mengganggu pengembangan AI dan penerapannya di dunia nyata.
< kelas div=”thai”>
<
h1>KESIMPULAN Elon Musk percaya bahwa data pelatihan AI yang sebenarnya telah habis, dan penggunaan data sintetis adalah arah baru bagi industri AI. Hal ini tidak hanya membantu mengatasi kekurangan data tetapi juga memberikan manfaat biaya. Namun, penggunaan data sintetis juga menimbulkan banyak risiko, dan jika tidak disesuaikan pada waktunya, kurangnya data nyata dapat mempengaruhi perkembangan AI di masa depan.
Lihat detailnya dan daftar
Eksplorasi konten lain dari Heart To Heart
Berlangganan untuk dapatkan pos terbaru lewat email.