Модель распознавания в реальном времени с открытым исходным кодом

Автор：Eve Cole Время обновления：2025-03-26 04:00:02

RF-DETR-это открытая модель обнаружения объектов в реальном времени, разработанная командой Roboflow, стремящейся решить недостатки в скорости и точности существующих моделей. Если вы ищете более быстрое и более точное решение, чем серия YOLO, RF-DETR, несомненно, является идеальным выбором для вас.

RF-DETR не только стремится стать лидером в области признания в реальном времени, но и выбирает метод с открытым исходным кодом, позволяя разработчикам использовать его бесплатно и настраивать его для создания собственных эффективных инструментов обнаружения.

Представьте, что ваша интеллектуальная система наблюдения может мгновенно захватить каждый ключевой объект в видеопотоке, как опытный детектив, и это невероятно быстро. RF-DETR-такой эффективный «детектив». Он не только превосходит предыдущие модели в реальном времени в скорости, но и достигает качественного скачка в точности.

Согласно официальным данным, RF-DETR является первой моделью в реальном времени, получившей более 60% среднего среднего значения (MAP) на наборах данных COCO. Набор данных COCO известен как «олимпийский» в индустрии компьютерного зрения. Тот факт, что такие достижения полностью доказывают сильную силу RF-DETR.

Что еще более важно, RF-DETR не жертвует скоростью, обеспечивая высокую точность. Он достигает чрезвычайно низкой задержки на графическом процессоре, что делает признание в реальном времени по-настоящему возможным. Это, несомненно, является огромным благом для сценариев применения, которые требуют быстрого отклика, таких как автономное вождение, проверка качества промышленного качества, интеллектуальная безопасность и т. Д. Вы можете представить, что повышение эффективности будет неизмеримым, когда ваш робот распознает и захватывает целевые объекты на скорости молнии.

В течение долгого времени серия моделей YOLO, основанные на CNN, доминировала в области обнаружения объектов в реальном времени. Однако с разработкой технологий RF-DETR в качестве члена семейства DETR (Detection Transformer) принимает трансформаторную архитектуру. Эта архитектура может лучше моделировать глобальную информацию, тем самым достигнув более высокой точности распознавания в сложных сценариях.

В отличие от модели YOLO, архитектура DETR не требует, чтобы не максимум подавляло (NMS) для фильтрации ограничивающих ящиков, что в определенной степени повышает общую эксплуатационную эффективность. Команда Roboflow представила концепцию «полной задержки» в оценке, справедливо сравнивая производительность различных моделей. Результаты показывают, что RF-DETR превосходно работает как в скорости, так и в точности и строго оптимально парето на наборе данных COCO по сравнению с моделью YOLO.

Стоит отметить, что RF-DETR не полностью отказался от преимуществ CNN. Фактически, многие расширенные варианты DETR умно смешивают преимущества CNN и трансформатора. RF-DETR достигает превосходной производительности и мощной адаптивности доменов, объединяя LW-DETR с предварительно обученной сетью костей DINOV2. Это означает, что RF-DETR может хорошо работать, будь то общее распознавание объектов или более специализированные области, такие как аэрокосмические изображения, промышленные среды, природные пейзажи и т. Д.

Наиболее интересным является то, что RF-DETR выбрал открытый исходный код, после лицензионного соглашения Apache 2.0. Это означает, что разработчики могут свободно использовать, изменять и даже применять их к коммерческим проектам, не беспокоясь о проблемах авторских прав. Команда Roboflow не только предоставляет код модели, но и вдумчиво готовит ноутбук Colab, которая учит вас, как точно настроить пользовательские наборы данных. В будущем платформа Roboflow также предоставит более удобную поддержку модели и развертывания RF-DETR.

В настоящее время команда Roboflow запустила два размера модели: RF-DETR-Base (29 миллионов параметров) и RF-DETR-Large (128 миллионов параметров) для удовлетворения сценариев приложения различных потребностей в вычислительной мощности. Кроме того, RF-DETR поддерживает обучение с несколькими разрешениями, что означает, что вы можете гибко скорректировать разрешение вашей модели во время выполнения, находя наилучший баланс между точностью и задержкой.

Проект: https://top.aibase.com/tool/rf-detr