Situs web resmi www.binance.com/zh-cn :Masukkan situs web resmi ☜☜
Aplikasi: ☞☞ Unduh Aplikasi Resmi☜☜
Startup kecerdasan buatan Cina Deepseek baru-baru ini dengan diam-diam merilis model bahasa skala besar terbarunya, Deepseek-V3-0324, yang telah menarik perhatian luas dalam industri kecerdasan buatan. Model ini muncul di perpustakaan sumber daya AI memeluk wajah di 641GB, melanjutkan gaya rendah deepseek yang biasa. Itu tidak melakukan publisitas skala besar, dan hanya dilengkapi dengan file readme kosong dan bobot model.
Model ini dilisensikan dengan MIT, memungkinkannya digunakan secara gratis untuk keperluan komersial dan dapat berjalan langsung pada perangkat keras kelas konsumen, seperti Apple Mac Studio dengan M3 Ultra Chip. Peneliti AI Awni Hannun mengungkapkan di media sosial bahwa versi kuantitatif 4-bit dari Deepseek-V3-0324 berjalan lebih cepat dari 20 token per detik pada chip ultra 512GB M3. Meskipun harga Mac Studio yang tinggi, mampu menjalankan model skala besar secara lokal memecah ketergantungan AI teratas sebelumnya pada pusat data.

Deepseek-V3-0324 mengadopsi arsitektur ahli hybrid (MOE), yang hanya mengaktifkan sekitar 37 miliar parameter, bukan semua 685 miliar parameter saat melakukan tugas, sehingga sangat meningkatkan efisiensi. Pada saat yang sama, model ini juga menggabungkan potensi perhatian panjang (MLA) dan teknologi prediksi multi-token (MTP). MLA meningkatkan kemampuan pemahaman kontekstual model dalam teks panjang. MTP memungkinkan model untuk menghasilkan banyak token sekaligus, dan kecepatan output meningkat hampir 80%. Versi terkuantisasi 4-bit mengurangi permintaan penyimpanan menjadi 352GB, memungkinkan untuk menjalankan perangkat keras kelas konsumen kelas atas.
Menurut penguji awal, Deepseek-V3-0324 telah meningkat secara signifikan dibandingkan dengan versi sebelumnya. Peneliti AI Xeophon mengklaim bahwa model ini telah membuat lompatan besar di semua metrik uji, melampaui Claude Sonnet 3.5 Anthropic untuk menjadi model non-inferensi terbaik. Selain itu, tidak seperti Sonnet yang perlu dilanggar, berat Deepseek-V3-0324 dapat diunduh secara gratis.

Strategi rilis open source Deepseek sangat kontras dengan perusahaan AI barat. Openai dan Antropik Amerika Serikat telah menetapkan ambang pembayaran untuk model, sementara perusahaan AI Cina semakin cenderung kehilangan lisensi sumber terbuka. Strategi ini telah mempercepat pengembangan ekosistem AI China, dan raksasa teknologi seperti Baidu, Alibaba dan Tencent juga mengikuti dan merilis model AI open source. Menghadapi pembatasan chip NVIDIA, perusahaan Cina telah mengubah kelemahan mereka menjadi keunggulan kompetitif dengan menekankan efisiensi dan optimasi.
Deepseek-V3-0324 cenderung menjadi dasar dari model inferensi Deepseek-R2 yang akan datang. Permintaan komputasi model inferensi saat ini sangat besar. Jika Deepseek-R2 berkinerja baik, itu akan menimbulkan tantangan langsung bagi GPT-5 Openai yang dikabarkan.
Untuk pengguna dan pengembang yang ingin mengalami Deepseek-V3-0324, berat model lengkap dapat diunduh dari memeluk wajah, tetapi file-file tersebut besar dan membutuhkan sumber daya penyimpanan dan komputasi yang tinggi. Anda juga dapat memilih layanan cloud, seperti OpenRouter, yang menyediakan akses API gratis dan antarmuka obrolan yang ramah; Antarmuka obrolan Deepseek sendiri mungkin juga telah diperbarui untuk mendukung versi baru. Pengembang juga dapat mengintegrasikan model melalui penyedia layanan penalaran seperti laboratorium hiperbolik.
Perlu dicatat bahwa Deepseek-V3-0324 telah berubah dalam gaya komunikasi, dari gaya dialog seperti manusia hingga gaya yang lebih formal dan teknis. Pergeseran ini dimaksudkan untuk beradaptasi dengan skenario aplikasi profesional dan teknis, tetapi dapat memengaruhi daya tariknya dalam aplikasi yang berorientasi konsumen.
Strategi open source Deepseek membentuk kembali lanskap AI global. Sebelumnya, kesenjangan AI China dengan Amerika Serikat berjarak 1-2 tahun, tetapi sekarang telah menyempit secara signifikan menjadi 3-6 bulan, dan beberapa daerah bahkan telah mencapai mengejar ketinggalan. Sama seperti sistem Android mendapatkan dominasi global melalui open source, model AI open source diharapkan menonjol dalam kompetisi dengan berbagai aplikasi dan inovasi kolektif pengembang dan mempromosikan aplikasi teknologi AI yang lebih luas.