Pada Konferensi GTC pada 18 Maret, CEO NVIDIA Jensen Huang mengumumkan rencana yang menarik untuk meningkatkan kecepatan pemrosesan intelijen buatan Deepseek sebesar 30 kali dengan perangkat lunak yang baru diluncurkan. Langkah ini adalah respons NVIDIA terhadap gejolak pasar yang disebabkan oleh Program Kecerdasan Buatan R1 Deepseek. Teknologi Deepseek mampu secara signifikan mengurangi jumlah perhitungan yang diperlukan untuk setiap kueri, membuat investor untuk menyatakan kekhawatiran tentang prospek masa depan NVIDIA.

Perangkat lunak Dynamo Nvidia dapat mengalokasikan tugas inferensi AI hingga 1.000 GPU dalam pemrosesan paralel, sangat meningkatkan throughput kueri. Huang Renxun mengatakan bahwa menggunakan chip Blackwell baru, Dynamo mampu memberikan daya pemrosesan 30 kali lipat di bawah arsitektur yang sama. Peningkatan kemampuan ini memungkinkan pusat data AI untuk memproses lebih banyak token per detik, sehingga meningkatkan pendapatan secara keseluruhan.
Secara khusus, perangkat lunak Dynamo dapat meningkatkan pemrosesan per detik dengan harga $ 1 per juta token. Ini berarti bahwa penyedia layanan dapat memilih untuk memproses lebih banyak pertanyaan pelanggan pada saat yang sama, atau memberikan layanan yang lebih kuat kepada satu pengguna, sehingga membebankan biaya yang lebih tinggi. Nvidia menyebut layanan AI berkinerja tinggi ini sebagai "Pabrik AI."
Untuk lebih meningkatkan kinerja Deepseek, NVIDIA juga telah merilis versi Deepseek R1 Tweak di Huggingface. Versi ini menggunakan lebih sedikit jumlah bit yang dihitung, yaitu "FP4", yang sangat meningkatkan kinerja tanpa secara signifikan mengurangi akurasi model.
Selain Dynamo, NVIDIA juga telah meluncurkan versi terbaru dari chip Blackwell "Ultra", yang meningkatkan kapasitas memori dan kinerja keseluruhan. Selain itu, NVIDIA telah secara resmi merilis DGX Spark, komputer pribadi kecil untuk pengembang AI, dan memperbarui konfigurasi komputer desktop stasiun DGX.
Pada konferensi ini, NVIDIA juga mempresentasikan beberapa produk dan proyek kolaborasi baru lainnya, termasuk peningkatan sakelar jaringan dan model perangkat lunak untuk robot medis, menunjukkan kemampuan inovasi NVIDIA yang berkelanjutan di bidang AI dan komputasi.
Poin -Poin Kunci:
NVIDIA meluncurkan perangkat lunak Dynamo, yang meningkatkan kecepatan pemrosesan AI Deepseek sebesar 30 kali.
Melalui Dynamo, penyedia layanan dapat menangani permintaan pelanggan lebih efisien dan meningkatkan pendapatan.
Versi baru chip Blackwell "Ultra" dan DGX Spark Computer juga secara resmi dirilis di konferensi.