Likuiditas resmi berbasis silikon Weibo baru-baru ini merilis pengumuman penting yang mengumumkan bahwa API Deepseek-R1 dan V3 dari platform siliconcloud sekarang mendukung inferensi batch. Peluncuran fitur baru ini menandai terobosan besar lain dalam aliran berbasis silikon di bidang layanan kecerdasan buatan.
Melalui Batch API, pengguna dapat mengirim sejumlah besar permintaan pemrosesan data ke platform Siliconcloud tanpa khawatir tentang pembatasan tingkat inferensi real-time. Menurut pengantar resmi, tugas inferensi batch diharapkan akan selesai dalam waktu 24 jam, sangat meningkatkan efisiensi pemrosesan data. Yang lebih menarik adalah bahwa harga inferensi batch Deepseek-V3 secara langsung berkurang 50% dibandingkan dengan inferensi real-time. Selain itu, dari 11 Maret hingga 18 Maret, penalaran batch Deepseek-R1 meluncurkan aktivitas diskon 75%, dengan harga input hanya 1 yuan/juta token, dan harga output juga turun menjadi 4 yuan/juta token.
Pengenalan fungsi inferensi batch memberi pengguna solusi yang lebih efisien untuk menangani tugas data skala besar. Apakah itu menghasilkan laporan, membersihkan data, atau melakukan analisis data, evaluasi kinerja model dan skenario lainnya, fungsi baru ini dapat memainkan peran penting. Terutama cocok untuk tugas pemrosesan data yang tidak memerlukan respons real-time, memungkinkan pengguna untuk menikmati layanan berkualitas tinggi dari Deepseek-R1 dan V3 API dengan biaya lebih rendah.
