Dengan model penalaran Deepseek-R1 yang diluncurkan oleh perusahaan AI China Deepseek, yang telah menarik perhatian luas di seluruh dunia, kinerja stabilitasnya pada platform pihak ketiga telah menjadi topik hangat dalam lingkaran teknologi baru-baru ini. Menurut data diskusi dan ulasan terbaru pada platform X, kinerja Deepseek-R1 bervariasi secara signifikan di seluruh platform hosting, dengan kelengkapan, akurasi, dan waktu penalaran yang bervariasi berdasarkan pilihan platform. Fenomena ini tidak hanya mengungkapkan kompleksitas penyebaran model, tetapi juga memberikan referensi penting bagi pengguna untuk memilih layanan hosting yang sesuai.
Dalam hal pengujian latar belakang dan metode, menurut umpan balik dari pengguna X dan lembaga evaluasi profesional, uji stabilitas lintas platform baru-baru ini untuk Deepseek-R1 telah menarik perhatian luas. Tes ini dipimpin oleh Departemen Intelijen Buatan Pusat Evaluasi Perangkat Lunak China, dan lebih dari selusin platform pihak ketiga domestik dan asing termasuk pencarian nano-Ai, Alibaba Bailian, aliran berbasis silikon, dll., Menggunakan 20 masalah penalaran matematika dasar yang terpadu (dikembangkan oleh tim Superclue) sebagai tolok ukur. Evaluasi ini terutama berfokus pada tiga dimensi: tingkat respons, akurasi, dan waktu penalaran, dan menganalisis perbedaan antara layanan gratis dan berbayar.

Hasil pengujian menunjukkan bahwa stabilitas Deepseek-R1 sangat tergantung pada platform hosting. Pencarian Nano AI sangat luar biasa karena terhubung ke "Versi Darah Penuh" Deepseek-R1 dan menyediakannya secara gratis. X USER @OP7418 Diposting pada 27 Februari: "Pencarian AI nanomik terhubung ke versi penuh deepseek-R1 pada pertama kalinya, dan tampil baik dalam evaluasi." Platform ini memenangkan pujian karena tingkat responsnya yang tinggi dan output yang stabil, dan dianggap sebagai praktik konsep Zhou Hongyi tentang "popularisasi AI".
Namun, kinerja platform lain tidak memuaskan. X pengguna @SimonKuang938 menunjukkan pada 24 Februari bahwa ketika Deepseek-R1 Alibaba Bailian berurusan dengan tugas-tugas logis yang kompleks (seperti grafik menggambar atau diagram alir), itu sering dipotong karena konsumsi memori yang berlebihan, yang dihasilkan dalam kegagapan klien, meskipun koneksi tersebut tidak terputus. Dia bercanda menyebut pengalaman ini "buruk" yang mencerminkan ketidakpuasan beberapa pengguna dengan stabilitas.
Sebaliknya, likuiditas berbasis silikon diakui oleh @simonkuang938 karena membatasi penggunaan bonus dan memberikan versi berbayar yang stabil. Dia mengatakan pada 22 Februari: "Ada terlalu sedikit platform yang berhati-hati seperti aliran berbasis silikon. R1 adalah versi berdarah penuh dan belum dimodifikasi." Ini menunjukkan bahwa layanan berbayar mungkin memiliki lebih banyak keuntungan dalam stabilitas.
Menilai dari umpan balik pengguna pada X, kinerja Deepseek-R1 dalam skenario yang berbeda juga memiliki keunggulannya sendiri. @changli71829684 disebutkan pada 25 Februari bahwa R1 cenderung jatuh ke dalam siklus mati ketika menghasilkan lebih dari 3.000 kata dalam satu percakapan. Meskipun kepadatan informasinya tinggi dan cocok untuk penambangan pengetahuan, akurasinya dan kualitas produksinya sedikit tidak cukup. Dia percaya bahwa model ini lebih cocok untuk "pembukaan pikiran" daripada untuk tugas yang tepat. Selain itu, @ORAN_GE menemukan bahwa versi fine-tuning (SFT) tanpa pengawasan itu aneh pada pertanyaan sederhana, seperti mengeluarkan formula matematika ketika membalas "halo" yang menunjukkan ketidakstabilan model dalam skenario tertentu.
Perlu disebutkan bahwa beberapa pengguna mencoba mengoptimalkan pengalaman pengguna R1. @ORAN_GE berbagi solusi untuk terhubung ke internet melalui API pada 12 Februari, mengatakan bahwa "sebenarnya diukur adalah pengalaman pengguna R1 yang paling stabil dan tercepat", yang sepenuhnya menyelesaikan masalah lag dan jaringan. Eksplorasi ini menunjukkan bahwa konfigurasi teknis di luar platform juga dapat mempengaruhi stabilitas.
Tes lintas platform ini tidak hanya mengekspos tantangan penyebaran Deepseek-R1, tetapi juga memicu diskusi tentang komersialisasi dan stabilitas model open source. Pengguna X umumnya percaya bahwa meskipun Deepseek-R1 berkinerja baik dalam tolok ukur matematika dan pemrograman (seperti skor Math-500 97,3%), stabilitasnya dalam aplikasi aktual masih perlu dioptimalkan. Tekanan lalu lintas dan beban layanan gratis yang tinggi dapat menyebabkan degradasi kinerja, sementara platform berbayar memberikan pengalaman yang lebih andal melalui alokasi sumber daya.
Dalam hal ini, orang dalam industri merekomendasikan agar pengguna memilih platform hosting sesuai dengan kebutuhan mereka. Untuk pengembang yang mengejar tingkat respons yang tinggi dan output lengkap, layanan stabil seperti pencarian nano-AI atau aliran berbasis silikon adalah pilihan yang baik; Untuk pengguna yang perlu menangani tugas inferensi yang kompleks, platform berbayar mungkin lebih mampu memenuhi kebutuhan. Sementara itu, para pejabat Deepseek dipanggil untuk lebih banyak dukungan perangkat keras atau tingkatan yang dibayar untuk mengurangi masalah kemacetan layanan gratis, seperti yang diharapkan @Graypsyche di pos 8 Februari.
Penilaian stabilitas platform pihak ketiga Deepseek-R1 mengungkapkan fakta utama: Meskipun model ini memiliki potensi besar, kinerja sebenarnya bervariasi berdasarkan lingkungan hosting. Dari layanan yang efisien dan gratis untuk pencarian AI Nano, hingga masalah cutoff Alibaba Bailian, hingga pengalaman berbayar yang stabil dari aliran berbasis silikon, pengguna perlu menimbang biaya dan kinerja. Dengan popularitas teknologi AI, pengembangan Deepseek-R1 di masa depan dan daya saingnya di pasar global mungkin tergantung pada apakah ia dapat menyelesaikan tantangan stabilitas ini. Diskusi panas pada platform X masih berlanjut, dan topik ini pasti akan terus menarik perhatian industri.