talk2bev скачать - talk2bev исходный код скачать

talk2bev

Другой исходный код

1.0.0

Скачать

Talk2bev: карты с птичьим глазом с усиленным языком

Project Page | Arxiv | Видео

Vikrant Dewangan* ¹ , Tushar Choudhary* ¹ , Shivam Chandhok* ² , Shubham Priyadarshan ¹ , Anushka Jain ¹ , Arun K. Singh ³ , Siddharth Srivastava ⁴ , Кришна Мурти Джатаваллабхула $^ Dagger $ ⁵ , К. Мадхава Кришна $^ Dagger $ ¹

¹ Международный институт информационных технологий Хайдарабад, ² Университета Британской Колумбии, ³ Университета Тарту ⁴ Tensortour Inc ⁵ MIT-CSAIL

*обозначает равный вклад, $^ Dagger $ обозначает равные советы

ICRA 2024

Методология.mp4

Абстрактный

Мы вводим Talk2bev, большой интерфейс модели языка (LVLM) для карт вида птичьего полета (BEV), обычно используемых в автономном вождении.

В то время как существующие системы восприятия для сценариев автономного вождения в основном были сосредоточены на предполагаемом (закрытом) наборе категорий объектов и сценариях вождения, Talk2Bev устраняет необходимость в специфической обучении BEV, вместо этого полагаясь на производительные предварительно обученные LVLMS. Это позволяет одной системе удовлетворить различные задачи автономных вождений, охватывающих визуальные и пространственные рассуждения, предсказывая намерения актеров дорожного движения, и принятие решений на основе визуальных сигналов.

Мы широко оцениваем Talk2BEV по большому количеству задач понимания сцен, которые зависят как на способность интерпретировать свободные запросы естественного языка, так и на основе этих запросов в визуальном контексте, встроенном в карту BEV с усилением языка. Чтобы обеспечить дальнейшие исследования в области LVLMS для сценариев автономного вождения, мы разрабатываем и выпускаем Talk2bev-Bench, контрольный показатель, включающий 1000 сценариев BEV, а также более 20 000 вопросов и ответов на землю из набора Nuscenes.

Подготовка данных

Пожалуйста, загрузите набор данных Nuscenes v1.0 Trainval. Наш набор данных состоит из 2 частей-Talk2bev-Base и Talk2bev-Captions, состоящие из базовых (культур, перспективных изображений, центроидов зоны BEV) и подписей соответственно.

Скачать ссылки

Мы предоставляем 2 ссылки на набор данных Talk2BEV ( Talk2Bev-Mini (только подписи) и Talk2bev-Full ), приведены ниже. Набор данных размещен на Google Drive. Пожалуйста, загрузите набор данных и извлеките файлы в папку data .

Имя	База	Подписи	Лавка	Связь
Talk2bev- Mini	✓	✗	✗	связь
Talk2bev- Полный	✗	✗	✗	Тодо

Если вы хотите генерировать набор данных с нуля, следуйте процессу здесь. Формат для каждой из частей данных описан в формате.

Оценка

Оценка на Talk2BEV происходит с помощью 2 методов - MCQ (от Talk2Bev -Bench) и пространственных операторов. Мы используем GPT-4 для нашей оценки. Пожалуйста, следуйте инструкциям в GPT-4 и инициализируйте ключ и организацию API в вашей ОС ENV.

ORGANIZATION= < your-organization >
API_KEY= < your-api-key >

Оценка - MCQS

Чтобы получить точность для MCQS, запустите следующую команду:

 cd evaluation
python eval_mcq.py

Это даст точность для MCQ.

Оценка пространственных операторов

Чтобы получить ошибку расстояния, я для MCQS, пожалуйста, запустите следующую команду:

 cd evaluation
python eval_spops.py

Click2chat

Мы также разрешаем разговор в свободной форме с BEV. Пожалуйста, следуйте инструкциям в Click2chat, чтобы пообщаться с BEV.

Talk2bev-bench

Чтобы быть выпущенным

Тодо

Пространственный трубопровод оценки пространственных операторов
Добавить ссылки на BEV CROPS-выпустить Talk2bev-full
Выпуск Talk2bev-Bench

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-02-26
размер 77.03MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

talk2bev

Talk2bev: карты с птичьим глазом с усиленным языком

Абстрактный

Подготовка данных

Скачать ссылки

Оценка

Оценка - MCQS

Оценка пространственных операторов

Click2chat

Talk2bev-bench

Тодо

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf