Загрузка yolact - Загрузка исходного кода yolact

Ты будешь

    ██╗   ██╗ ██████╗ ██╗      █████╗  ██████╗████████╗
    ╚██╗ ██╔╝██╔═══██╗██║     ██╔══██╗██╔════╝╚══██╔══╝
     ╚████╔╝ ██║   ██║██║     ███████║██║        ██║   
      ╚██╔╝  ██║   ██║██║     ██╔══██║██║        ██║   
       ██║   ╚██████╔╝███████╗██║  ██║╚██████╗   ██║   
       ╚═╝    ╚═════╝ ╚══════╝╚═╝  ╚═╝ ╚═════╝   ╚═╝

Простая, полностью сверточная модель для сегментации экземпляров в реальном времени. Это код для наших документов:

Йолакт: сегментация экземпляра в реальном времени
Yolact ++: лучшая сегментация экземпляров в реальном времени

Yolact ++ (v1.2) выпущен! (Изменение)

Модель RESNET50 от YOLACT ++ работает со скоростью 33,5 кадров в секунду на Titan XP и достигает 34,1 карты на test-dev Coco (посмотрите на нашу журнальную статью здесь).

Чтобы использовать Yolact ++, убедитесь, что вы составляете код DCNV2. (См. Установку)

Для демонстрации в реальном времени, посмотрите наше видео ICCV:

Некоторые примеры из нашей модели базового желтка (33,5 кадров в секунду на титане XP и 29,8 карты на test-dev Коко):

Пример 0

Пример 1

Пример 2

Установка

Клонировать это хранилище и введите его:
```
git clone https://github.com/dbolya/yolact.git
cd yolact
```
Установите среду, используя один из следующих методов:
- Использование Anaconda
  - Запустить conda env create -f environment.yml
- Вручную с PIP
  - Установите среду Python3 (например, с использованием virtenv).
  - Установите Pytorch 1.0.1 (или выше) и Touchvision.
  - Установите другие пакеты:
```
 # Cython needs to be installed before pycocotools
pip install cython
pip install opencv-python pillow pycocotools matplotlib 
```
Если вы хотите тренировать YOLACT, загрузите набор данных COCO и аннотации 2014/2017. Обратите внимание, что этот скрипт займет некоторое время и выбросит 21 ГБ файлов в ./data/coco .
```
sh data/scripts/COCO.sh
```
Если вы хотите оценить YOLACT на test-dev , загрузите test-dev с помощью этого сценария.
```
sh data/scripts/COCO_test.sh
```
Если вы хотите использовать Yolact ++, составьте деформируемые сверточные сверточные слои (от DCNV2). Убедитесь, что у вас есть последний инструментарий CUDA, установленные с веб -сайта NVIDIA.
```
 cd external/DCNv2
python setup.py build develop
```

Оценка

Вот наши модели YOLACT (выпущенные 5 апреля 2019 г.) вместе с их FPS на Titan XP и MAP на test-dev :

Размер изображения	Магистраль	Кадр	карта	Вес
550	RESNET50-FPN	42,5	28.2	yolact_resnet50_54_800000.pth	Зеркало
550	Darknet53-Fpn	40.0	28,7	yolact_darknet53_54_800000.pth	Зеркало
550	RESNET101-FPN	33,5	29,8	yolact_base_54_800000.pth	Зеркало
700	RESNET101-FPN	23.6	31.2	yolact_im700_54_800000.pth	Зеркало

Модели YOLACT ++ (выпущенные 16 декабря 2019 г.):

Размер изображения	Магистраль	Кадр	карта	Вес
550	RESNET50-FPN	33,5	34.1	yolact_plus_resnet50_54_800000.pth	Зеркало
550	RESNET101-FPN	27.3	34.6	yolact_plus_base_54_800000.pth	Зеркало

Чтобы оценить модель, поместите соответствующий файл веса в каталог ./weights и запустите одну из следующих команд. Имя каждой конфигурации - это все, что номера в имени файла (например, yolact_base для yolact_base_54_800000.pth ).

Количественные результаты на Coco

 # Quantitatively evaluate a trained model on the entire validation set. Make sure you have COCO downloaded as above.
# This should get 29.92 validation mask mAP last time I checked.
python eval.py --trained_model=weights/yolact_base_54_800000.pth

# Output a COCOEval json to submit to the website or to use the run_coco_eval.py script.
# This command will create './results/bbox_detections.json' and './results/mask_detections.json' for detection and instance segmentation respectively.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --output_coco_json

# You can run COCOEval on the files created in the previous command. The performance should match my implementation in eval.py.
python run_coco_eval.py

# To output a coco json file for test-dev, make sure you have test-dev downloaded from above and go
python eval.py --trained_model=weights/yolact_base_54_800000.pth --output_coco_json --dataset=coco2017_testdev_dataset

Качественные результаты на Coco

 # Display qualitative results on COCO. From here on I'll use a confidence threshold of 0.15.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --display

Брингеринг на Коко

 # Run just the raw model on the first 1k images of the validation set
python eval.py --trained_model=weights/yolact_base_54_800000.pth --benchmark --max_images=1000

Изображения

 # Display qualitative results on the specified image.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=my_image.png

# Process an image and save it to another file.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=input_image.png:output_image.png

# Process a whole folder of images.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --images=path/to/input/folder:path/to/output/folder

Видео

 # Display a video in real-time. "--video_multiframe" will process that many frames at once for improved performance.
# If you want, use "--display_fps" to draw the FPS directly on the frame.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=my_video.mp4

# Display a webcam feed in real-time. If you have multiple webcams pass the index of the webcam you want instead of 0.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=0

# Process a video and save it to another file. This uses the same pipeline as the ones above now, so it's fast!
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=input_video.mp4:output_video.mp4

Как вы можете сказать, eval.py может сделать кучу вещей. Запустите команду --help , чтобы увидеть все, что она может сделать.

python eval.py --help

Обучение

По умолчанию мы тренируемся на Коко. Обязательно загрузите весь набор данных, используя вышеуказанные команды.

Чтобы тренироваться, возьмите представленную ImageNet модель и поместите ее в ./weights .
- Для RESNET101, скачать resnet101_reducedfc.pth отсюда.
- Для RESNET50 скачать resnet50-19c8e357.pth отсюда.
- Для Darknet53, скачать darknet53.pth отсюда.
Запустите одну из учебных команд ниже.
- Обратите внимание, что вы можете нажать CTRL+C во время обучения, и он сохранит файл *_interrupt.pth на текущей итерации.
- Все веса сохраняются в каталоге ./weights по умолчанию с именем файла <config>_<epoch>_<iter>.pth .

 # Trains using the base config with a batch size of 8 (the default).
python train.py --config=yolact_base_config

# Trains yolact_base_config with a batch_size of 5. For the 550px models, 1 batch takes up around 1.5 gigs of VRAM, so specify accordingly.
python train.py --config=yolact_base_config --batch_size=5

# Resume training yolact_base with a specific weight file and start from the iteration specified in the weight file's name.
python train.py --config=yolact_base_config --resume=weights/yolact_base_10_32100.pth --start_iter=-1

# Use the help option to see a description of all available command line arguments
python train.py --help

Поддержка мульти-GPU

Йолакт теперь плавно поддерживает несколько графических процессоров во время тренировок:

Прежде чем запустить какие -либо сценарии, запустите: export CUDA_VISIBLE_DEVICES=[gpus]
- Где вы должны заменить [графические процессоры] на запятую список индекса каждого графического процессора, который вы хотите использовать (например, 0,1,2,3).
- Вы все равно должны сделать это, если использовать только 1 графический процессор.
- Вы можете проверить индексы ваших графических процессоров с помощью nvidia-smi .
Затем просто установите размер партии на 8*num_gpus с помощью команд обучения выше. Сценарий обучения автоматически масштабирует гиперпараметры до нужных значений.
- Если у вас есть запасная память, вы можете увеличить размер партии, но сохраните ее кратное количество графических процессоров, которые вы используете.
- Если вы хотите выделить изображения на графический процессор, специфичный для различных графических процессоров, вы можете использовать --batch_alloc=[alloc] , где [Alloc] является списком разделенного запятой, содержащим количество изображений на каждом графическом процессоре. Это должно суммировать batch_size .

Регистрация

Йолакт теперь регистрирует обучение и информацию о проверке по умолчанию. Вы можете отключить это с помощью --no_log . Руководство по тому, как визуализировать эти журналы, скоро появится, но теперь вы можете посмотреть на LogVizualizer в utils/logger.py для помощи.

Pascal SBD

Мы также включаем конфигурацию для обучения по аннотациям Pascal SBD (для быстрых экспериментов или сравнения с другими методами). Чтобы тренироваться на Pascal SBD, выполните следующие шаги:

Загрузите набор данных отсюда. Это первая ссылка в верхней части «Обзор» (и файл называется benchmark.tgz ).
Извлеките набор данных где -нибудь. В наборе данных должна быть папка с названием dataset/img . Создайте каталог ./data/sbd (где . Jyolact's root) и скопируйте dataset/img to ./data/sbd/img .
Скачайте аннотации в стиле кокоса отсюда.
Извлеките аннотации в ./data/sbd/ .
Теперь вы можете тренироваться с помощью --config=yolact_resnet50_pascal_config . Проверьте эту конфигурацию, чтобы увидеть, как расширить его на другие модели.

Я скоро автоматизирую все это с помощью сценария, не волнуйтесь. Кроме того, если вам нужен сценарий, который я использовал для преобразования аннотаций, я вкладываю его в ./scripts/convert_sbd.py , но вам придется проверить, как это работает, чтобы иметь возможность использовать его, потому что на самом деле я не помню.

Если вы хотите проверить наши результаты, вы можете скачать наши веса yolact_resnet50_pascal_config отсюда. Эта модель должна получить 72,3 маски AP_50 и 56,2 Маски AP_70. Обратите внимание, что «все» AP не совпадает с «VOL» AP, сообщенным в других статьях для Pascal (они используют средние значения порогов от 0.1 - 0.9 с шагом 0.1 вместо того, что использует Коко).

Пользовательские наборы данных

Вы также можете тренироваться на своем собственном наборе данных, выполнив эти шаги:

Создайте файл аннотации JSON Degence Annation File JSON в стиле Coco для вашего. Спецификацию для этого можно найти здесь. Обратите внимание, что мы не используем некоторые поля, поэтому следующие могут быть опущены:
- info
- liscense
- По image : license, flickr_url, coco_url, date_captured
- categories (мы используем наш собственный формат для категорий, см. Ниже)
Создайте определение для вашего набора данных в dataset_base в data/config.py (см. Комментарии в dataset_base для объяснения каждого поля):

 my_custom_dataset = dataset_base . copy ({
    'name' : 'My Dataset' ,

    'train_images' : 'path_to_training_images' ,
    'train_info' :   'path_to_training_annotation' ,

    'valid_images' : 'path_to_validation_images' ,
    'valid_info' :   'path_to_validation_annotation' ,

    'has_gt' : True ,
    'class_names' : ( 'my_class_id_1' , 'my_class_id_2' , 'my_class_id_3' , ...)
})

Пара вещей, чтобы отметить:
- Идентификаторы классов в файле аннотации должны начинаться с 1 и последовательно увеличиваться по порядку class_names . Если это не так для вашего файла аннотации (например, в Coco), см. Полевой label_map в dataset_base .
- Если вы не хотите создавать разделение валидации, используйте один и тот же путь изображения и файл аннотаций для проверки. По умолчанию (см. python train.py --help ), train.py будет выводить карту проверки для первых 5000 изображений в наборе данных каждые 2 эпох.
Наконец, в yolact_base_config в том же файле измените значение для 'dataset' на 'my_custom_dataset' или как вы назвали объект конфигурации выше. Затем вы можете использовать любую из команд обучения в предыдущем разделе.

Создание пользовательского набора данных с нуля

Смотрите этот хороший пост от @amit12690 для советов о том, как аннотировать пользовательский набор данных и подготовить его для использования с помощью Yolact.

Цитирование

Если вы используете Yolact или этот кодовый базу в вашей работе, пожалуйста, цитируйте

 @inproceedings{yolact-iccv2019,
  author    = {Daniel Bolya and Chong Zhou and Fanyi Xiao and Yong Jae Lee},
  title     = {YOLACT: {Real-time} Instance Segmentation},
  booktitle = {ICCV},
  year      = {2019},
}

Для Yolact ++ цитируйте

 @article{yolact-plus-tpami2020,
  author  = {Daniel Bolya and Chong Zhou and Fanyi Xiao and Yong Jae Lee},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence}, 
  title   = {YOLACT++: Better Real-time Instance Segmentation}, 
  year    = {2020},
}

Контакт

Для вопросов о нашей статье или коде, пожалуйста, свяжитесь с Даниэлем Болеей.

Расширять

yolact

Ты будешь

Yolact ++ (v1.2) выпущен! (Изменение)

Для демонстрации в реальном времени, посмотрите наше видео ICCV:

Установка

Оценка

Количественные результаты на Coco

Качественные результаты на Coco

Брингеринг на Коко

Изображения

Видео

Обучение

Поддержка мульти-GPU

Регистрация

Pascal SBD

Пользовательские наборы данных

Создание пользовательского набора данных с нуля

Цитирование

Контакт

ToDo Co

Python Portfolio

datamule python

Инструмент диаграмм данных с открытым исходным кодом Redash v24.10.0

платформа визуализации данных смарт-диаграмм v6.9

Инструмент нагрузочного тестирования Locus v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express

yolact

Ты будешь​​​​

Yolact ++ (v1.2) выпущен! (Изменение)

Для демонстрации в реальном времени, посмотрите наше видео ICCV:

Установка

Оценка

Количественные результаты на Coco

Качественные результаты на Coco

Брингеринг на Коко

Изображения

Видео

Обучение

Поддержка мульти-GPU

Регистрация

Pascal SBD

Пользовательские наборы данных

Создание пользовательского набора данных с нуля

Цитирование

Контакт

Ты будешь