
Drivelm: graph vを使用して運転する
Autonomous Driving Challenge 2024言語のリーダーボードでの運転。
NuscenesとCarlaに基づいて構築されたデータセット( Drivelm-Data )をインスタンス化し、グラフVQAとエンドツーエンド運転を共同で実行するためのVLMベースのベースラインアプローチ( Drivelm-Agent )を提案します。
? DrivelmはCVPR 2024 Autonomous Driving Challengeのメイントラックとして機能します。チャレンジに必要なものはすべて、ベースライン、テストデータ、提出形式、評価パイプラインなど、ここにあります。

[2025/01/08]ドライブベンチリリース! Drivelmが実際にベンチマークするものの詳細な分析。 Arxivをご覧ください。[2024/07/16] Drivelmの公式リーダーボードが再開されました![2024/07/01] DrivelmはECCV 2024に受け入れられました!チームにおめでとう![2024/06/01]チャレンジは終わりました!最終的なリーダーボードを参照してください。[2024/03/25]チャレンジテストサーバーはオンラインであり、テストの質問がリリースされます。 chekc out![2024/02/29]チャレンジリポジトリのリリース。ベースライン、データおよび提出形式、評価パイプライン。見てください![2023/08/25] Drivelm-Nuscenesデモがリリースされました。[2023/12/22] Drivelm-Nuscenes Full v1.0と紙がリリースされました。 Drivelmを始めるために:
(トップに戻る)
- 実際のアプリケーションでのGPTスタイルのマルチモーダルモデルの出現は、運転における言語の役割の研究を動機付けています。
- 以下の日付は、ARXIV提出日を反映しています。
- 仕事がない場合は、私たちに連絡してください!

Drivelmは、コミュニティが直面する課題のいくつかに対処しようとします。
(トップに戻る)
(トップに戻る)
私たちは、それらの間のつながりとして、人間が作成した推論論理を備えたPerception, Prediction, Planning, Behavior, Motionタスクを促進します。 drivelm-dataでGVQAのタスクを提案します。
Drivelm-Dataは、グラフ構造の論理依存関係を使用して、駆動タスクの完全なスタックを促進する第一言語駆動データセットです。

GVQAタスク、データセット機能、および注釈の詳細へのリンク。
(トップに戻る)
このリポジトリのすべての資産とコードは、特に指定されていない限り、Apache 2.0ライセンスの下にあります。言語データは、CC BY-NC-SA 4.0に基づいています。他のデータセット(ヌスケンを含む)は、独自の流通ライセンスを継承します。彼らがあなたの研究を支援するなら、私たちの論文とプロジェクトを引用することを検討してください。
@article { sima2023drivelm ,
title = { DriveLM: Driving with Graph Visual Question Answering } ,
author = { Sima, Chonghao and Renz, Katrin and Chitta, Kashyap and Chen, Li and Zhang, Hanxue and Xie, Chengen and Luo, Ping and Geiger, Andreas and Li, Hongyang } ,
journal = { arXiv preprint arXiv:2312.14150 } ,
year = { 2023 }
} @misc { contributors2023drivelmrepo ,
title = { DriveLM: Driving with Graph Visual Question Answering } ,
author = { DriveLM contributors } ,
howpublished = { url{https://github.com/OpenDriveLab/DriveLM} } ,
year = { 2023 }
}(トップに戻る)
opendrivelab
自律ビジョングループ
(トップに戻る)