
Drivelm: القيادة مع G raph v isual q uestion a nswering
Autonomous Driving Challenge 2024 المتصدرين في القيادة مع اللغة .
نحن نؤسس مجموعات البيانات ( drivelm-data ) التي تم بناؤها على nuscenes و carla ، ونقترح نهج خط الأساس القائم على VLM ( DriveLm-Agent ) لأداء مشترك VQA والقيادة من طرف إلى طرف.
؟ يعمل DriveLm كمسار رئيسي في CVPR 2024 Autonomous Driving Challenge . كل ما تحتاجه للتحدي هو هنا ، بما في ذلك خط الأساس وبيانات الاختبار وتنسيق التقديم وخط أنابيب التقييم!

[2025/01/08] إصدار محرك-BECK! تحليل متعمق في ما هي القياس القياسي حقًا. ألق نظرة على Arxiv.[2024/07/16] إعادة فتح المتصدرين الرسميين![2024/07/01] تم قبول Drivelm إلى ECCV 2024! مبروك للفريق![2024/06/01] انتهى التحدي! انظر المتصدرين النهائي.[2024/03/25] خادم اختبار التحدي هو عبر الإنترنت ويتم إصدار أسئلة الاختبار. Chekc ذلك![2024/02/29] تحدي إطلاق الريبو. خط الأساس والبيانات وتنسيق التقديم ، خط أنابيب التقييم. إلقاء نظرة![2023/08/25] تم إصدار Drivelm-Nuscenes Demo.[2023/12/22] Drivelm-Nuscenes Full v1.0 و Paper. للبدء مع drivelm:
(العودة إلى الأعلى)
- إن ظهور النماذج متعددة الوسائط على غرار GPT في التطبيقات الواقعية يحفز دراسة دور اللغة في القيادة.
- يعكس التاريخ أدناه تاريخ تقديم Arxiv.
- إذا كان هناك أي عمل مفقود ، فيرجى التواصل معنا!

يحاول Drivelm معالجة بعض التحديات التي يواجهها المجتمع.
(العودة إلى الأعلى)
(العودة إلى الأعلى)
نحن نسهل Perception, Prediction, Planning, Behavior, Motion مع منطق التفكير المكتوب على الإنسان كعلاقة بينهما. نقترح مهمة GVQA على drivelm-data.
Drivelm-Data هي أول مجموعة بيانات تقرّحة اللغة تسهل المجموعة الكاملة من مهام القيادة مع تبعيات منطقية منظمة للرسم البياني.

روابط إلى تفاصيل حول مهمة GVQA وميزات مجموعة البيانات والشرح.
(العودة إلى الأعلى)
جميع الأصول والرمز في هذا المستودع تخضع لترخيص Apache 2.0 ما لم ينص على خلاف ذلك. بيانات اللغة تحت CC BY-NC-SA 4.0. ترث مجموعات البيانات الأخرى (بما في ذلك nuscenes) تراخيص التوزيع الخاصة بها. يرجى التفكير في الاستشهاد الورقي والمشروع إذا كانوا يساعدون في بحثك.
@article { sima2023drivelm ,
title = { DriveLM: Driving with Graph Visual Question Answering } ,
author = { Sima, Chonghao and Renz, Katrin and Chitta, Kashyap and Chen, Li and Zhang, Hanxue and Xie, Chengen and Luo, Ping and Geiger, Andreas and Li, Hongyang } ,
journal = { arXiv preprint arXiv:2312.14150 } ,
year = { 2023 }
} @misc { contributors2023drivelmrepo ,
title = { DriveLM: Driving with Graph Visual Question Answering } ,
author = { DriveLM contributors } ,
howpublished = { url{https://github.com/OpenDriveLab/DriveLM} } ,
year = { 2023 }
}(العودة إلى الأعلى)
opendrivelab
مجموعة الرؤية المستقلة
(العودة إلى الأعلى)