Dari laboratorium penelitian AI yang didukung oleh dana investasi swasta kecil yang diketahui di Cina, Deepseek menjadi perhatian dan kejutan global di seluruh Lembah Silikon.
Deepseek tampaknya melampaui perusahaan seperti Openai, Google dan Meta dalam balapan AI yang berisiko. Model teori open source baru yang diumumkan laboratorium ini, Deepseek R1, dikatakan lebih unggul dari model AI saat ini dalam tugas matematika dan penalaran.
Pada tanggal 27 Januari, Asisten AI Laboratorium Cina melewati Chatgte untuk menjadi aplikasi gratis yang paling dihargai di App Store di AS.
Model AI Deepseek tidak hanya membuat raksasa barat khawatir tetapi juga muncul bahwa AS mungkin berjuang untuk mempertahankan posisi dominannya dalam “Perang Dingin”.
Menurut laporan Reuters, keberhasilan Deepsek mengguncang keyakinan bahwa itu akan memastikan posisi terdepan dalam chip, menyebabkan berbagi teknologi tergelincir.
Bagaimana Deepseek?
Meskipun mencapai tonggak penting dalam waktu singkat, Deepseek dikatakan hanya fokus pada AI dan tidak memiliki rencana untuk mengkomersialkan model AI segera.
“Saya belum menemukan alasan komersial (untuk membangun Deepseek) bahkan jika Anda bertanya. Penelitian ilmiah dasar memiliki tingkat investasi investasi yang sangat rendah. Ketika investor awal Openai menuangkan uang, mereka tentu saja tidak memikirkan uang untuk diterima. Sebaliknya, mereka benar -benar ingin melakukan ini, ”kata Liang kepada 36KR.
Deepseek tidak bergantung pada pendanaan dari raksasa teknologi seperti Baidu, Alibaba dan Bytedance. Perusahaan ini hanya didukung oleh flyer tinggi. Menurut Forbes Report, perusahaan memiliki kemitraan dengan produsen chip AMD. AMD menyediakan energi untuk model seperti Deepseek-V3 dengan AMD Instinct dan ROCM Software.
Deepseek juga merupakan salah satu perusahaan AI terkemuka di Cina untuk menerapkan prinsip open source.
Meskipun definisi open source masih kontroversial, model AI yang diperdaya dengan terbuka disediakan sehingga siapa pun dapat mengunduh, memodifikasi, dan digunakan. Penerbitan model AI dan data pelatihan sesuai dengan lisensi daya terbuka dapat menarik lebih banyak pengguna dan pengembang, membuat model lebih maju.
Model AI yang bertenaga terbuka juga datang dengan beberapa risiko keamanan karena dapat digunakan untuk tujuan yang salah.
Deepseek merilis siapa yang menjadi model?
Model AI Deepseek diperkirakan telah dioptimalkan dengan menggabungkan mekanisme dan teknik canggih.
Dua di antaranya termasuk campuran ahli (Moe mee (MOE) dan memperhatikan perhatian laten multi-pencarian (MHA).
MOE adalah teknik yang banyak model khusus (para ahli) bekerja bersama, dengan jaringan gerbang ahli terbaik untuk menyelesaikan masalah untuk setiap input, membantu melatih model yang kuat dengan biaya yang wajar.
MHA memastikan penalaran yang efektif melalui kompresi yang signifikan dari unit data.
Beberapa model AI bertenaga terbuka yang dikembangkan oleh Deepseek meliputi: Deepseek Coder (dirancang untuk tugas terkait enkripsi), Deepseek LLM (dengan 67 miliar parameter untuk bersaing dengan model bahasa besar lainnya.); Deepseek-V2 (model AI murah dengan kinerja yang kuat), Deepseek-Coder-V2 (model AI memiliki 236 miliar parameter yang dirancang untuk tantangan enkripsi yang kompleks), Deepseek-V3 (model AI ada 671 miliar parameter yang dapat menangani banyak tugas seperti enkripsi ada 671 miliar yang dapat menangani banyak tugas seperti enkripsi ada 671 miliar yang dapat menangani banyak tugas seperti enkripsi ada 671 miliar yang dapat menangani banyak tugas seperti enkripsi yang dapat menangani banyak tugas , Terjemahan, esai dan email), Deepseek-R1 (model AI yang dirancang untuk tugas teoretis, dengan kemampuan untuk menantang model O1 of Openai), Deepseek-R1-Distill (model AI telah di-tweak berdasarkan data sintetis yang dibuat oleh Deepseek R1).
Masa depan Deepseek
Sejak 2022, Amerika Serikat telah menerbitkan langkah -langkah kontrol ekspor, membatasi pendekatan perusahaan AI dengan GPU seperti NVIDIA H100. Meskipun Deepseek memiliki cadangan 10.000 GPU H100, perusahaan membutuhkan lebih banyak chip untuk memperluas model AI -nya.
Sumber Daya Terbatas membuat Deepseek menggunakannya lebih efektif. Ruang penelitian AI telah mengulang proses untuk mengurangi beban pada GPU, seperti yang diungkapkan oleh Wang, mantan karyawan mantan karyawan Deepseek, dengan MIT Technology Review.
Meskipun Deepseek dapat mengembangkan dan menggunakan model AI yang kuat tanpa mengakses perangkat keras terbaru, perusahaan masih perlu mempersempit kesenjangan perhitungan di beberapa titik untuk memperluas skala skala.
Dari laboratorium penelitian AI yang didukung oleh dana investasi swasta kecil yang diketahui di Cina, Deepseek menjadi perhatian dan kejutan global di seluruh Lembah Silikon.
Deepseek tampaknya melampaui perusahaan seperti Openai, Google dan Meta dalam balapan AI yang berisiko. Model teori open source baru yang diumumkan laboratorium ini, Deepseek R1, dikatakan lebih unggul dari model AI saat ini dalam tugas matematika dan penalaran.
Pada tanggal 27 Januari, Asisten AI Laboratorium Cina melewati Chatgte untuk menjadi aplikasi gratis yang paling dihargai di App Store di AS.
Model AI Deepseek tidak hanya membuat raksasa barat khawatir tetapi juga muncul bahwa AS mungkin berjuang untuk mempertahankan posisi dominannya dalam “Perang Dingin”.
Menurut laporan Reuters, Keberhasilan Deepseek mengguncang keyakinan bahwa penurunan miliaran dolar dalam chip akan memastikan posisi terdepan, menyebabkan stok teknologi tergelincir.

Pendiri Deepseek – Liang Wenfeng.
Mulai dan Ubah Arah
Pada 2013, pengusaha Cina Liang Wenfeng mendirikan dana investasi yang lebih tinggi. Untuk menganalisis data keuangan dan mendukung kegiatan yang kompleks untuk dana tersebut, High-Flyer mendirikan studi mendalam tentang pemecah api dan unit pemrosesan grafis (GPU) untuk memproduksi komputer super.
Pada tahun 2023, Liang memutuskan untuk mengalihkan sumber daya dana ke dalam perusahaan baru bernama Deepseek dengan tujuan mengembangkan model AI dasar dan akhirnya mendekode kecerdasan buatan (AGI).
Alih -alih mempekerjakan insinyur yang berpengalaman, mengetahui cara membangun produk AI terhadap konsumen, Liang merekrut mahasiswa pascasarjana PhD dari universitas -universitas terkemuka Cina untuk bergabung dengan tim peneliti.
Pendekatan Liang untuk membangun kelompok penelitian dianggap telah berkontribusi pada keberhasilan Deepseek. “Seluruh kelompok memiliki budaya kerja sama dan dedikasi yang sama untuk penelitian intensif”, Zihan Wang, mantan mantan karyawan Deepseek, mengatakan di atas Ulasan Teknologi MIT.

Deepseek tersedia di Web dan App Store Apple.
Bagaimana Deepseek?
Meskipun mencapai tonggak penting dalam waktu singkat, Deepseek dikatakan hanya fokus pada AI dan tidak memiliki rencana untuk mengkomersialkan model AI segera.
“Saya belum menemukan alasan komersial (untuk membangun Deepseek) bahkan jika Anda bertanya. Penelitian ilmiah dasar memiliki tingkat investasi investasi yang sangat rendah. Ketika investor awal Openai menuangkan uang, mereka tentu saja tidak memikirkan uang untuk diterima. Sebaliknya, mereka benar -benar ingin melakukan ini ”, Liang memberi tahu 36KR.
Deepseek tidak bergantung pada pendanaan dari raksasa teknologi seperti Baidu, Alibaba dan Bytedance. Perusahaan ini hanya didukung oleh flyer tinggi. Menurut Forbes Report, perusahaan memiliki kemitraan dengan produsen chip AMD. AMD menyediakan energi untuk model seperti Deepseek-V3 dengan AMD Instinct dan ROCM Software.
Deepseek juga merupakan salah satu perusahaan AI terkemuka di Cina untuk menerapkan prinsip open source.
Meskipun definisi open source masih kontroversial, model AI yang diperdaya dengan terbuka disediakan sehingga siapa pun dapat mengunduh, memodifikasi, dan digunakan. Penerbitan model AI dan data pelatihan sesuai dengan lisensi daya terbuka dapat menarik lebih banyak pengguna dan pengembang, membuat model lebih maju.
Model AI yang bertenaga terbuka juga datang dengan beberapa risiko keamanan karena dapat digunakan untuk tujuan yang salah.

Model Deepseek dianggap dapat bersaing dengan chatgpt Openai.
Deepseek merilis siapa yang menjadi model?
Model AI Deepseek diperkirakan telah dioptimalkan dengan menggabungkan mekanisme dan teknik canggih.
Dua di antaranya termasuk campuran ahli (Moe mee (MOE) dan memperhatikan perhatian laten multi-pencarian (MHA).
MOE adalah teknik yang banyak model khusus (para ahli) bekerja bersama, dengan jaringan gerbang ahli terbaik untuk menyelesaikan masalah untuk setiap input, membantu melatih model yang kuat dengan biaya yang wajar.
MHA memastikan penalaran yang efektif melalui kompresi yang signifikan dari unit data.
Beberapa model AI bertenaga terbuka yang dikembangkan oleh Deepseek meliputi: Deepseek Coder (dirancang untuk tugas terkait enkripsi), Deepseek LLM (dengan 67 miliar parameter untuk bersaing dengan model bahasa besar lainnya.); Deepseek-V2 (model AI murah dengan kinerja yang kuat), Deepseek-Coder-V2 (model AI memiliki 236 miliar parameter yang dirancang untuk tantangan enkripsi yang kompleks), Deepseek-V3 (model AI ada 671 miliar parameter yang dapat menangani banyak tugas seperti enkripsi ada 671 miliar yang dapat menangani banyak tugas seperti enkripsi ada 671 miliar yang dapat menangani banyak tugas seperti enkripsi ada 671 miliar yang dapat menangani banyak tugas seperti enkripsi yang dapat menangani banyak tugas , Terjemahan, esai dan email), Deepseek-R1 (model AI yang dirancang untuk tugas teoretis, dengan kemampuan untuk menantang model marquee O1 Openai), Deepseek-R1-Distill (model AI telah di-tweak berdasarkan data sintetis yang dibuat oleh Deepseek R1).
Masa depan Deepseek
Sejak 2022, Amerika Serikat telah menerbitkan langkah -langkah kontrol ekspor, membatasi pendekatan perusahaan AI dengan GPU seperti NVIDIA H100. Meskipun Deepseek memiliki cadangan 10.000 GPU H100, perusahaan membutuhkan lebih banyak chip untuk memperluas model AI -nya.
Sumber Daya Terbatas membuat Deepseek menggunakannya lebih efektif. Departemen Penelitian AI ini telah mengulang proses untuk mengurangi beban pada GPU, seperti yang diungkapkan oleh Wang, mantan staf Deepseek, dengan Ulasan Teknologi MIT.
Meskipun Deepseek dapat mengembangkan dan menggunakan model AI yang kuat tanpa mengakses perangkat keras terbaru, perusahaan masih perlu mempersempit kesenjangan perhitungan di beberapa titik untuk memperluas skala skala.
< Div class = "kehamilan">
< H1> Kesimpulan Deepseek Cina telah melampaui raksasa AI dengan berfokus pada penelitian AI dan mengembangkan model dasar dan AGI. Perusahaan tidak hanya mengkhawatirkan pesaing Barat tetapi juga mengalahkan model AI teratas. Keberhasilan Deepseek telah mengguncang keyakinan bahwa berinvestasi dalam chip tidak menjamin posisi terdepan, menyebabkan saham teknologi tergelincir. Untuk berkembang, Deepseek membutuhkan lebih banyak chip dan mempersempit kesenjangan perhitungan untuk bersaing lebih efektif dengan perusahaan -perusahaan Amerika.
Eksplorasi konten lain dari Heart To Heart
Berlangganan untuk dapatkan pos terbaru lewat email.