Dari pengkodean hingga penulisan kreatif Xai Grok -3 mengalahkan GPT4.5 untuk mencapai puncak artikel Model Big Model - AI

Penulis：Eve Cole Waktu Pembaruan：2025-05-16 13:50:02

Xai baru-baru ini merilis berita menarik, dengan model AI terbaru Grok-3 tampil luar biasa di peringkat Chatbot Arena. Model, yang disebut "Grok-3Preview-02-24", telah menunjukkan kemampuannya yang kuat di banyak bidang utama dan telah menjadi sorotan di bidang AI.

Dalam kompetisi sengit dari Chatbot Arena, Grok-3-Preview-02-24 melampaui GPT4.5-preview dengan margin sempit 1 poin, mendapatkan lebih dari 3.000 suara untuk mengikat tempat pertama. Model ini berkinerja sangat baik dalam menangani isyarat kompleks, tugas pengkodean, masalah matematika, penulisan kreatif, kepatuhan instruksional, dan pertanyaan panjang. Chatbot Arena adalah platform crowdsourcing untuk evaluasi model bahasa skala besar (LLM) melalui preferensi manusia, dan menggunakan sistem peringkat ELO untuk memberi peringkat model, memberikan ukuran kinerja yang komprehensif.

Prestasi ini tidak hanya menandai kemajuan yang signifikan di bidang AI, tetapi juga mencerminkan ambisi pendirinya Elon Musk untuk mempromosikan pengembangan teknologi AI. Musk telah berkomitmen untuk mengembangkan sistem AI yang kuat yang konsisten dengan nilai-nilai kemanusiaan, dan keberhasilan Grok-3 tidak diragukan lagi merupakan bukti yang kuat untuk visi ini.

Perlu dicatat bahwa "Grok-3Preview-02-24" digambarkan sebagai model produksi terbaru, tetapi kata "pratinjau" dalam namanya mungkin menunjukkan bahwa model tersebut masih dalam fase pengujian. Detail ini memicu diskusi tentang kesiapan produksi penuh, sementara juga meninggalkan ruang untuk optimasi dan peningkatan di masa depan.