
DRIVELM: Mengemudi dengan G Raph V ISUAL Q UESTION A NSWERING
Autonomous Driving Challenge 2024 Papan peringkat mengemudi-dengan-bahasa .
Kami instantiate kumpulan data ( Data-Data ) yang dibangun di atas Nuscenes dan Carla, dan mengusulkan pendekatan dasar berbasis VLM ( DRIVELM-AGEN ) untuk secara bersama-sama melakukan grafik VQA dan mengemudi ujung-ke-ujung.
? Drivelm berfungsi sebagai trek utama dalam CVPR 2024 Autonomous Driving Challenge . Semua yang Anda butuhkan untuk tantangan ada di sini, termasuk baseline, data uji dan format pengiriman dan pipa evaluasi!

[2025/01/08] Rilis drive-bench! Analisis mendalam dalam apa yang benar-benar dilakukan oleh Drivelm. Lihatlah Arxiv.[2024/07/16] Papan peringkat resmi Drivelm dibuka kembali![2024/07/01] Drivelm diterima untuk ECCV 2024! Selamat untuk tim![2024/06/01] Tantangan berakhir! Lihat papan peringkat terakhir.[2024/03/25] Tantangan Tes Server online dan pertanyaan tes dirilis. Chekc itu![2024/02/29] Rilis Repo Tantangan. Baseline, format data dan pengiriman, pipa evaluasi. Lihat![2023/08/25] Demo drivelm-nuscenes dirilis.[2023/12/22] DRIVELM-NUSCENES v1.0 dan kertas dilepaskan. Untuk memulai dengan drivelm:
(kembali ke atas)
- Munculnya model multimodal gaya GPT dalam aplikasi dunia nyata memotivasi studi tentang peran bahasa dalam mengemudi.
- Tanggal di bawah ini mencerminkan tanggal pengiriman ARXIV.
- Jika ada pekerjaan yang hilang, silakan hubungi kami!

Drivelm berupaya mengatasi beberapa tantangan yang dihadapi oleh masyarakat.
(kembali ke atas)
(kembali ke atas)
Kami memfasilitasi Perception, Prediction, Planning, Behavior, Motion dengan logika penalaran yang ditulis manusia sebagai hubungan di antara mereka. Kami mengusulkan tugas GVQA pada Data Data.
Drivelm-Data adalah dataset mengemudi bahasa pertama yang memfasilitasi tumpukan penuh tugas mengemudi dengan ketergantungan logis terstruktur grafik.

Tautan ke detail tentang tugas GVQA, fitur dataset, dan anotasi.
(kembali ke atas)
Semua aset dan kode dalam repositori ini berada di bawah lisensi Apache 2.0 kecuali ditentukan sebaliknya. Data bahasa berada di bawah CC BY-NC-SA 4.0. Dataset lain (termasuk nuscenes) mewarisi lisensi distribusi mereka sendiri. Harap pertimbangkan mengutip makalah dan proyek kami jika membantu penelitian Anda.
@article { sima2023drivelm ,
title = { DriveLM: Driving with Graph Visual Question Answering } ,
author = { Sima, Chonghao and Renz, Katrin and Chitta, Kashyap and Chen, Li and Zhang, Hanxue and Xie, Chengen and Luo, Ping and Geiger, Andreas and Li, Hongyang } ,
journal = { arXiv preprint arXiv:2312.14150 } ,
year = { 2023 }
} @misc { contributors2023drivelmrepo ,
title = { DriveLM: Driving with Graph Visual Question Answering } ,
author = { DriveLM contributors } ,
howpublished = { url{https://github.com/OpenDriveLab/DriveLM} } ,
year = { 2023 }
}(kembali ke atas)
Opendrivelab
Kelompok Visi Otonomi
(kembali ke atas)