yolactダウンロードyolactソースコードのダウンロード

y ou o nly l ook a t c oefficient s

    ██╗   ██╗ ██████╗ ██╗      █████╗  ██████╗████████╗
    ╚██╗ ██╔╝██╔═══██╗██║     ██╔══██╗██╔════╝╚══██╔══╝
     ╚████╔╝ ██║   ██║██║     ███████║██║        ██║   
      ╚██╔╝  ██║   ██║██║     ██╔══██║██║        ██║   
       ██║   ╚██████╔╝███████╗██║  ██║╚██████╗   ██║   
       ╚═╝    ╚═════╝ ╚══════╝╚═╝  ╚═╝ ╚═════╝   ╚═╝

リアルタイムインスタンスセグメンテーションのためのシンプルで完全な畳み込みモデル。これは私たちの論文のコードです：

Yolact：リアルタイムインスタンスセグメンテーション
Yolact ++：より良いリアルタイムインスタンスセグメンテーション

Yolact ++（V1.2）がリリースされました！（changelog）

Yolact ++のResNet50モデルは、Titan XPで33.5 fpsで実行され、Cocoのtest-devで34.1マップを達成します（こちらのジャーナルペーパーをご覧ください）。

Yolact ++を使用するには、DCNV2コードをコンパイルしてください。（インストールを参照）

リアルタイムのデモについては、ICCVビデオをご覧ください。

Yolactベースモデルの例（Titan XPの33.5 fpsおよびCocoのtest-devの29.8マップ）：

インストール

このリポジトリをクローンして入力します。
```
git clone https://github.com/dbolya/yolact.git
cd yolact
```
次の方法のいずれかを使用して環境を設定します。
- アナコンダの使用
  - conda env create -f environment.yml実行します
- ピップで手動で
  - Python3環境をセットアップします（例：VirtenVを使用）。
  - Pytorch 1.0.1（またはそれ以上）とTorchvisionをインストールします。
  - 他のパッケージをインストールします。
```
 # Cython needs to be installed before pycocotools
pip install cython
pip install opencv-python pillow pycocotools matplotlib 
```
YOLACTをトレーニングしたい場合は、COCOデータセットと2014/2017 Annotationsをダウンロードしてください。このスクリプトには時間がかかり、21GBのファイルを./data/cocoにダンプすることに注意してください。
```
sh data/scripts/COCO.sh
```
test-devでyolactを評価したい場合は、このスクリプトでtest-devをダウンロードしてください。
```
sh data/scripts/COCO_test.sh
```
Yolact ++を使用する場合は、変形可能な畳み込み層（DCNV2から）をコンパイルします。 NvidiaのWebサイトから最新のCUDAツールキットがインストールされていることを確認してください。
```
 cd external/DCNv2
python setup.py build develop
```

評価

Titan XPでのFPSとtest-devのマップとともに、YOLACTモデル（2019年4月5日にリリース）とともに次のとおりです。

画像サイズ	バックボーン	FPS	地図	ウェイト
550	resnet50-fpn	42.5	28.2	yolact_resnet50_54_800000.pth	鏡
550	darknet53-fpn	40.0	28.7	yolact_darknet53_54_800000.pth	鏡
550	resnet101-fpn	33.5	29.8	yolact_base_54_800000.pth	鏡
700	resnet101-fpn	23.6	31.2	Yolact_im700_54_800000.pth	鏡

Yolact ++モデル（2019年12月16日にリリース）：

画像サイズ	バックボーン	FPS	地図	ウェイト
550	resnet50-fpn	33.5	34.1	yolact_plus_resnet50_54_800000.pth	鏡
550	resnet101-fpn	27.3	34.6	yolact_plus_base_54_800000.pth	鏡

モデルを評価するには、対応するWeightsファイルを./weightsディレクトリに配置し、次のコマンドのいずれかを実行します。各構成の名前は、ファイル名の番号の前にすべてです（例： yolact_base_54_800000.pthのyolact_base ）。

ココの定量的結果

 # Quantitatively evaluate a trained model on the entire validation set. Make sure you have COCO downloaded as above.
# This should get 29.92 validation mask mAP last time I checked.
python eval.py --trained_model=weights/yolact_base_54_800000.pth

# Output a COCOEval json to submit to the website or to use the run_coco_eval.py script.
# This command will create './results/bbox_detections.json' and './results/mask_detections.json' for detection and instance segmentation respectively.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --output_coco_json

# You can run COCOEval on the files created in the previous command. The performance should match my implementation in eval.py.
python run_coco_eval.py

# To output a coco json file for test-dev, make sure you have test-dev downloaded from above and go
python eval.py --trained_model=weights/yolact_base_54_800000.pth --output_coco_json --dataset=coco2017_testdev_dataset

ココの定性的結果

 # Display qualitative results on COCO. From here on I'll use a confidence threshold of 0.15.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --display

ココのベンチマーク

 # Run just the raw model on the first 1k images of the validation set
python eval.py --trained_model=weights/yolact_base_54_800000.pth --benchmark --max_images=1000

画像

 # Display qualitative results on the specified image.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=my_image.png

# Process an image and save it to another file.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=input_image.png:output_image.png

# Process a whole folder of images.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --images=path/to/input/folder:path/to/output/folder

ビデオ

 # Display a video in real-time. "--video_multiframe" will process that many frames at once for improved performance.
# If you want, use "--display_fps" to draw the FPS directly on the frame.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=my_video.mp4

# Display a webcam feed in real-time. If you have multiple webcams pass the index of the webcam you want instead of 0.
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=0

# Process a video and save it to another file. This uses the same pipeline as the ones above now, so it's fast!
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=input_video.mp4:output_video.mp4

あなたが言うことができるように、 eval.pyたくさんのことをすることができます。 --helpコマンドを実行して、できるすべてのことを確認します。

python eval.py --help

トレーニング

デフォルトでは、ココでトレーニングします。上記のコマンドを使用して、必ずデータセットをダウンロードしてください。

訓練するには、Imagenet-Prestrainedモデルをつかんで./weightsに入れます。
- resnet101の場合、ここからresnet101_reducedfc.pthをダウンロードしてください。
- ResNet50の場合、ここからresnet50-19c8e357.pthをダウンロードしてください。
- darknet53については、ここからdarknet53.pthをダウンロードしてください。
以下のトレーニングコマンドの1つを実行します。
- トレーニング中にctrl+Cを押すことができ、現在のイテレーションで*_interrupt.pthファイルを保存できることに注意してください。
- すべての重みは、ファイル名<config>_<epoch>_<iter>.pthでデフォルトで./weightsディレクトリに保存されます。

 # Trains using the base config with a batch size of 8 (the default).
python train.py --config=yolact_base_config

# Trains yolact_base_config with a batch_size of 5. For the 550px models, 1 batch takes up around 1.5 gigs of VRAM, so specify accordingly.
python train.py --config=yolact_base_config --batch_size=5

# Resume training yolact_base with a specific weight file and start from the iteration specified in the weight file's name.
python train.py --config=yolact_base_config --resume=weights/yolact_base_10_32100.pth --start_iter=-1

# Use the help option to see a description of all available command line arguments
python train.py --help

マルチGPUサポート

Yolactは、トレーニング中に複数のGPUをシームレスにサポートするようになりました。

スクリプトを実行する前に、実行する： export CUDA_VISIBLE_DEVICES=[gpus]
- [GPU]を使用する各GPUのインデックスのコンマ分離リストに置き換える必要があります（例：0,1,2,3）。
- 1 GPUのみを使用する場合は、これを行う必要があります。
- GPUのインデックスをnvidia-smiで確認できます。
次に、上記のトレーニングコマンドを使用して、バッチサイズを8*num_gpusに設定するだけです。トレーニングスクリプトは、ハイパーパラメーターを適切な値に自動的にスケーリングします。
- メモリが必要な場合は、バッチサイズをさらに増やすことができますが、使用しているGPUの数の数を増やすことができます。
- 異なるGPUに特異的なGPUごとの画像を割り当てる場合は、 --batch_alloc=[alloc]を使用できます。ここで、[alloc]は各GPUの画像の数を含むコンマが発します。これはbatch_sizeに合計する必要があります。

ロギング

Yolactは、デフォルトでトレーニングと検証情報を記録するようになりました。 --no_logでこれを無効にすることができます。これらのログを視覚化する方法に関するガイドはまもなく登場しますが、今ではutils/logger.pyのLogVizualizerをご覧ください。

Pascal SBD

また、Pascal SBDアノテーションに関するトレーニングの構成も含めます（迅速な実験または他の方法との比較用）。 Pascal SBDでトレーニングするには、次の手順を進めます。

ここからデータセットをダウンロードしてください。これは、上部の「概要」セクションの最初のリンクです（ファイルはbenchmark.tgzと呼ばれます）。
どこかでデータセットを抽出します。データセットにはdataset/imgというフォルダーが必要です。ディレクトリ./data/sbd （ここ. yolactのルート）を作成し、 dataset/imgを./data/sbd/imgにコピーします。
ここからココスタイルの注釈をダウンロードしてください。
./data/sbd/に注釈を抽出します。
これで、 --config=yolact_resnet50_pascal_configを使用してトレーニングできます。その構成を確認して、他のモデルに拡張する方法を確認してください。

私はこれをすぐにスクリプトで自動化します、心配しないでください。また、アノテーションを変換するために使用したスクリプトが必要な場合は、 ./scripts/convert_sbd.py convert_sbd.pyに入れますが、実際に覚えていないため、使用できるように機能する方法を確認する必要があります。

結果を確認する場合は、 yolact_resnet50_pascal_configのウェイトをここからダウンロードできます。このモデルは、72.3マスクAP_50および56.2マスクAP_70を取得するはずです。「All」APは、Pascalの他の論文で報告された「Vol」APと同じではないことに注意してください（CoCoが使用するものではなく0.1の増分で、 0.1 - 0.9でしきい値の平均を使用しています）。

カスタムデータセット

また、次の手順に従って、自分のデータセットでトレーニングすることもできます。

データセットのココスタイルオブジェクト検出jsonアノテーションファイルを作成します。これの仕様はここにあります。一部のフィールドは使用していないため、以下は省略できます。
- info
- liscense
- imageの下： license, flickr_url, coco_url, date_captured
- categories （カテゴリに独自の形式を使用します。以下を参照）
data/config.pyのdataset_baseの下にデータセットの定義を作成します（各フィールドの説明については、 dataset_baseのコメントを参照してください）：

 my_custom_dataset = dataset_base . copy ({
    'name' : 'My Dataset' ,

    'train_images' : 'path_to_training_images' ,
    'train_info' :   'path_to_training_annotation' ,

    'valid_images' : 'path_to_validation_images' ,
    'valid_info' :   'path_to_validation_annotation' ,

    'has_gt' : True ,
    'class_names' : ( 'my_class_id_1' , 'my_class_id_2' , 'my_class_id_3' , ...)
})

注意すべきいくつかのこと：
- アノテーションファイルのクラスIDは1から始まり、 class_namesの順序で順番に増加する必要があります。これがアノテーションファイル（COCOのように）に当てはまらない場合は、 dataset_baseのフィールドlabel_map参照してください。
- 検証の分割を作成したくない場合は、検証のために同じ画像パスとアノテーションファイルを使用します。デフォルトでは（ python train.py --helpを参照）、 train.py 、2つのエポックごとにデータセット内の最初の5000画像の検証マップを出力します。
最後に、同じファイルのyolact_base_configで、 'dataset'の値を'my_custom_dataset'または上記のconfigオブジェクトに指定したものに変更します。次に、前のセクションでトレーニングコマンドを使用できます。

ゼロからカスタムデータセットを作成します

カスタムデータセットに注釈を付け、YOLACTで使用するために準備する方法のヒントについては、 @Amit12690によるこの素敵な投稿を参照してください。

引用

仕事でYolactまたはこのコードベースを使用している場合は、引用してください

 @inproceedings{yolact-iccv2019,
  author    = {Daniel Bolya and Chong Zhou and Fanyi Xiao and Yong Jae Lee},
  title     = {YOLACT: {Real-time} Instance Segmentation},
  booktitle = {ICCV},
  year      = {2019},
}

Yolact ++については、引用してください

 @article{yolact-plus-tpami2020,
  author  = {Daniel Bolya and Chong Zhou and Fanyi Xiao and Yong Jae Lee},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence}, 
  title   = {YOLACT++: Better Real-time Instance Segmentation}, 
  year    = {2020},
}

接触

私たちの論文またはコードに関する質問については、ダニエル・ボリャにお問い合わせください。

拡大する

yolact

y ou o nly l ook a t c oefficient s

Yolact ++（V1.2）がリリースされました！（changelog）

リアルタイムのデモについては、ICCVビデオをご覧ください。

インストール

評価

ココの定量的結果

ココの定性的結果

ココのベンチマーク

画像

ビデオ

トレーニング

マルチGPUサポート

ロギング

Pascal SBD

カスタムデータセット

ゼロからカスタムデータセットを作成します

引用

接触

ToDo Co

Python Portfolio

datamule python

Redash オープンソースデータチャートツール v24.10.0

スマートチャートデータ視覚化プラットフォーム v6.9

Locust 負荷テストツール v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express

yolact

y ou o nly l ook a t c oefficient s

Yolact ++（V1.2）がリリースされました！ （changelog）

リアルタイムのデモについては、ICCVビデオをご覧ください。

インストール

評価

ココの定量的結果

ココの定性的結果

ココのベンチマーク

画像

ビデオ

トレーニング

マルチGPUサポート

ロギング

Pascal SBD

カスタムデータセット

ゼロからカスタムデータセットを作成します

引用

接触

Yolact ++（V1.2）がリリースされました！（changelog）