Perusahaan kecerdasan buatan Elon Musk, Xai, merilis model bahasa terbaru Grok3 pada hari Senin ini, sebuah rilis yang menandai kemajuan signifikan yang telah dibuat perusahaan di bidang kecerdasan buatan. Musk mengungkapkan pada konferensi pers bahwa model baru ini memiliki sepuluh kali daya komputasi pendahulunya, berkat pusat data yang berbasis di Memphis, yang dilengkapi dengan sekitar 200.000 GPU, memberikan dukungan daya komputasi yang kuat untuk model tersebut.
Model Seri GROK3 telah meluncurkan berbagai varian, termasuk versi ramping yang mengorbankan bagian dari akurasi sambil meningkatkan kecepatan. Selain itu, model "Inference" yang baru diluncurkan dirancang khusus untuk menyelesaikan masalah matematika dan ilmiah, dan pengguna dapat menyesuaikan fitur -fitur ini melalui pengaturan "Think" dan "Brain" di antarmuka Grok. Xai mengatakan versi ini belum selesai, model ini masih dilatih terus menerus, dan tim berencana untuk melakukan perbaikan dan optimisasi lebih lanjut dalam beberapa minggu mendatang.
Menurut platform pembandingan AI Lmarena.ai, Grok3 mencetak lebih dari 1.400 di bidang chatbot, menjadi pemimpin di lapangan. Ini unggul dalam semua kategori seperti pemrograman, melampaui model OpenAI, Anthropic dan Google. Namun, kinerja aktual mungkin berbeda dari hasil benchmark. Sebagai contoh, meskipun skor Claude3.5Sonnet lebih rendah dari beberapa model dalam pengkodean tolok ukur, banyak pengguna masih menganggapnya sebagai pilihan yang lebih baik untuk tugas pemrograman.
Pendiri Openai Andrej Karpathy menerima akses awal ke Grok3 dan dia sangat memuji kemampuan penalaran logis model. Karpasi mengatakan fitur "Think" dapat berhasil menangani tugas-tugas kompleks seperti menghitung kegagalan pelatihan GPT-2 atau membuat mesh heksagonal untuk permainan papan, yang sebelumnya terbatas pada model high-end Openai saja. Selain itu, fitur ini meningkatkan keakuratan operasi matematika dasar, seperti penghitungan surat dan perbandingan desimal.
Dalam hal kemampuan pencarian baru, Karpasi mencatat bahwa kualitas DeepSearch sebanding dengan alat penelitian kebingungan, memberikan jawaban yang relevan untuk topik -topik seperti produk Apple yang akan datang dan dinamika stok Palantir. Namun, ia juga menemukan beberapa masalah yang jelas: model ini terkadang menghasilkan URL palsu, membuat pernyataan yang tidak didukung, dan hanya mengutip posting X pada petunjuk tertentu.
Selain itu, GROK3 juga tampaknya memiliki kurangnya kesadaran akan keberadaannya, kehilangan lokasi XAI di laboratorium AI utama. Keterbatasan ini telah meninggalkan DeepSearch belum pada tingkat kualitas Openai “Deep Research” dan berkinerja buruk pada masalah humor dan etika. Namun demikian, peluncuran GROK3 masih menunjukkan kekuatan yang kuat dan kemampuan inovasi XAI di bidang kecerdasan buatan.