2025 dianggap oleh industri sebagai "tahun pertama VLA mendapatkan mobil", dan teknologi model aksi bahasa visual (VLA) sangat mengubah bidang mengemudi yang cerdas. Model VLA memiliki kemampuan untuk beralasan di luar model bahasa visual tradisional (VLM), dan dapat memprediksi dan menangani kondisi jalan yang kompleks dengan lebih akurat, membawa kemampuan pengambilan keputusan yang unggul ke sistem mengemudi yang otonom. Artikel ini akan sangat mengeksplorasi status aplikasi teknologi VLA saat ini di bidang mengemudi cerdas, tren pengembangan masa depan dan dampaknya terhadap lanskap kompetitif industri.
Dalam industri mengemudi yang cerdas, 2025 dianggap sebagai "tahun pertama masuknya VLA", yang menandai kemunculan paradigma teknologi baru. VLA, model aksi-bahasa penglihatan, pada awalnya diusulkan oleh DeepMind pada tahun 2023 untuk meningkatkan pemahaman dan kemampuan respons robot terhadap lingkungan. Dalam beberapa tahun terakhir, teknologi ini telah menarik perhatian besar di bidang mengemudi otonom.
Dibandingkan dengan model bahasa visual tradisional (VLM), VLA memiliki keuntungan yang tidak hanya dapat menguraikan informasi gambar dan teks, tetapi juga membuat keputusan melalui pemikiran "seperti manusia".

Hal ini memungkinkan sistem mengemudi yang cerdas untuk lebih akurat tentang kondisi jalan yang kompleks, seperti membuat respons yang tepat di lokasi konstruksi atau perintah lalu lintas. Menurut penelitian Yuan Rong Qixing, VLA dapat memprediksi perubahan kondisi jalan dalam beberapa dekade mendatang, sementara VLM hanya dapat menyimpulkan situasi hanya dalam 7 detik. Kemampuan penalaran yang lebih kuat ini memberi VLA lebih banyak keuntungan dalam menangani kondisi jalan real-time, dan mempromosikan perkembangan cepat teknologi mengemudi yang cerdas.
Saat ini, pemain utama di industri ini, seperti Auto Ideal dan Yuanrong Qixing, telah mulai menerapkan teknologi ini dalam model mereka, menandai bahwa mengemudi yang cerdas memasuki tahap balap baru. Secara khusus, Yuanrong telah mencapai perjanjian kerja sama dengan banyak perusahaan mobil terkemuka, berencana untuk meluncurkan mobil pintar yang dilengkapi dengan model VLA pada tahun 2025. Langkah ini tidak hanya meningkatkan daya saing pasarnya, tetapi juga menjadi dasar yang kuat untuk pengembangannya di masa depan.
Dalam pasar yang semakin kompetitif, apakah perusahaan dapat membuat model "panas" telah menjadi indikator penting untuk mengevaluasi keberhasilannya. Penjualan panas model populer tidak hanya dapat memberikan dukungan data yang berharga bagi perusahaan, tetapi juga mempercepat iterasi dan peningkatan teknologi mengemudi yang cerdas. Pada tahun 2024, Auto dan Xiaomi Auto yang ideal dengan cepat mengumpulkan pangsa pasar dan kepercayaan pengguna dengan model terlaris mereka, menjadi tolok ukur di industri ini.
Pasar mengemudi yang cerdas sedang mengalami revolusi teknologi, dan kemunculan VLA telah membawa kemungkinan baru ke industri ini. Dengan peluncuran lebih banyak model dan kedewasaan teknologi yang berkelanjutan, mengemudi cerdas di masa depan akan lebih cerdas dan membawa pengguna pengalaman berkendara yang lebih baik.
Aplikasi teknologi VLA menunjukkan bahwa mengemudi yang cerdas telah memasuki tahap pengembangan baru. Ini akan menjadi pendorong utama persaingan dan inovasi yang berkelanjutan di industri mobil pintar.