CV pretrained model
Initial Release

事前に訓練されたモデルは、同様の問題を解決するために他の誰かによって作成されたモデルです。同様の問題を解決するためにゼロからモデルを構築する代わりに、他の問題でトレーニングされたモデルを出発点として使用できます。事前に訓練されたモデルは、アプリケーションで100%正確ではない場合があります。
たとえば、自己学習車を建設したい場合。まともな画像認識アルゴリズムをゼロから構築するために何年も費やすことができます。または、Imagenetデータ上に構築されたGoogleからInceptionモデル(事前トレーニングを受けたモデル)を取得して、それらの写真の画像を識別することができます。
Netronを使用して、各モデルのネットワークアーキテクチャの視覚化を確認できます。

| モデル名 | 説明 | フレームワーク | ライセンス |
|---|---|---|---|
| ObjectDetection | 単一の画像で複数のオブジェクトをローカライズおよび識別します。 | Tensorflow | Apacheライセンス |
| マスクr-cnn | このモデルは、画像内のオブジェクトの各インスタンスの境界ボックスとセグメンテーションマスクを生成します。特徴のピラミッドネットワーク(FPN)とResNet101バックボーンに基づいています。 | Tensorflow | MITライセンス(MIT) |
| より速いRCNN | これは、地域の提案ネットワークを使用したオブジェクト検出のための条約であるより高速なRCNNの実験的なテンソルフロー実装です。 | Tensorflow | MITライセンス |
| Yolo Tensorflow | これは、Yolo:リアルタイムオブジェクトの検出のTensorflow実装です。 | Tensorflow | カスタム |
| Yolo Tensorflow ++ | 「Yolo:リアルタイムオブジェクト検出」のTensorflow実装。トレーニングとモバイルデバイスでのリアルタイムランニングの実際のサポート。 | Tensorflow | GNU一般公開ライセンス |
| Mobilenet | モビレネットは、文献の人気モデルと好意的に比較しながら、レイテンシ、サイズ、精度の間でトレードオフします。 | Tensorflow | MITライセンス(MIT) |
| ディープラブ | セマンティック画像セグメンテーションのための深いラベル付け。 | Tensorflow | Apacheライセンス |
| コロネット | グレースケール画像を色付けするニューラルネットワーク。 | Tensorflow | 見つかりません |
| srgan | 生成的な敵対的なネットワークを使用した写真リアルな単一画像超解像度。 | Tensorflow | 見つかりません |
| Deeposm | OpenStreetMap機能と衛星画像を備えたTensorflowニューラルネットを列車に導きます。 | Tensorflow | MITライセンス(MIT) |
| ドメイン転送ネットワーク | 教師なしクロスドメイン画像生成の実装。 | Tensorflow | MITライセンス |
| 表示し、出席し、伝えます | 注意ベースの画像キャプションジェネレーター。 | Tensorflow | MITライセンス |
| Android-Yolo | Tensorflowを搭載したYoloネットワークを使用したAndroidでのリアルタイムオブジェクト検出。 | Tensorflow | Apacheライセンス |
| DCSCNスーパー解像度 | これは、深い学習ベースのシングルイメージスーパー解像度(SISR)モデルである「スキップ接続とネットワークを備えた深いCNNによる高速で正確な画像スーパー解像度」の断面フロー実装です。 | Tensorflow | 見つかりません |
| gan-cls | これは、合成画像の実験的なテンソルフロー実装です。 | Tensorflow | 見つかりません |
| u-net | 脳腫瘍のセグメンテーション用。 | Tensorflow | 見つかりません |
| Cycleganの改善 | 画像翻訳への対応のない画像。 | Tensorflow | MITライセンス |
| im2txt | 画像キャプションのための画像からテキストへのニューラルネットワーク。 | Tensorflow | Apacheライセンス |
| スリム | TF-SLIMの画像分類モデル。 | Tensorflow | Apacheライセンス |
| デルフ | 画像マッチングと検索のための深いローカル機能。 | Tensorflow | Apacheライセンス |
| 圧縮 | 事前に訓練された残差GRUネットワークを使用して、画像を圧縮および減圧します。 | Tensorflow | Apacheライセンス |
| 注意力 | 実際の画像テキスト抽出のモデル。 | Tensorflow | Apacheライセンス |
| モデル名 | 説明 | フレームワーク | ライセンス |
|---|---|---|---|
| マスクr-cnn | このモデルは、画像内のオブジェクトの各インスタンスの境界ボックスとセグメンテーションマスクを生成します。特徴のピラミッドネットワーク(FPN)とResNet101バックボーンに基づいています。 | Keras | MITライセンス(MIT) |
| VGG16 | 大規模な画像認識のための非常に深い畳み込みネットワーク。 | Keras | MITライセンス(MIT) |
| VGG19 | 大規模な画像認識のための非常に深い畳み込みネットワーク。 | Keras | MITライセンス(MIT) |
| resnet | 画像認識のための深い残留学習。 | Keras | MITライセンス(MIT) |
| Resnet50 | 画像認識のための深い残留学習。 | Keras | MITライセンス(MIT) |
| ナスネット | NASNETとは、Neural Architecture Search Networkを指します。これは、モデルアーキテクチャのファミリであり、モデルアーキテクチャを直接関心のあるデータセットで直接学習して設計されています。 | Keras | MITライセンス(MIT) |
| Mobilenet | KerasのMobilenet V1モデル。 | Keras | MITライセンス(MIT) |
| Mobilenet V2 | KerasのMobilenet V2モデル。 | Keras | MITライセンス(MIT) |
| Mobilenet V3 | KerasのMobilenet V3モデル。 | Keras | MITライセンス(MIT) |
| EfficientNet | 畳み込みニューラルネットワークのモデルスケーリングを再考します。 | Keras | MITライセンス(MIT) |
| 画像の類推 | ニューラルのマッチングとブレンドを使用して、画像の類推を生成します。 | Keras | MITライセンス(MIT) |
| 人気のある画像セグメンテーションモデル | ケラスにおけるSEGNET、FCN、UNETおよびその他のモデルの実装。 | Keras | MITライセンス |
| 超音波神経セグメンテーション | このチュートリアルは、Kerasライブラリを使用して、超音波画像神経セグメンテーションのために深いニューラルネットワークを構築する方法を示しています。 | Keras | MITライセンス |
| ディープマスクオブジェクトセグメンテーション | これは、学習オブジェクトセグメンテーションマスクのための複雑な深いニューラルネットワークであるディープマスクのKerasベースのPython実装です。 | Keras | 見つかりません |
| 単一言語および多言語の画像キャプション | これは、ニューラルシーケンスモデルを使用した多言語画像説明に伴うソースコードです。 | Keras | BSD-3-Clauseライセンス |
| pix2pix | Kerasは、Phillip Isola、Jun-Yan Zhu、Tinghui Zhou、Alexei Aによる条件付き敵対的ネットワークによる画像間翻訳の実装の実装A. | Keras | 見つかりません |
| カラフルな画像の色付け | B&Wは色になります。 | Keras | 見つかりません |
| サイクルガン | サイクル一貫性のある敵対的なネットワークを使用した、未解像の画像間翻訳の実装。 | Keras | MITライセンス |
| デュアルガン | デュアルガンの実装:画像間翻訳のための監視されていないデュアル学習。 | Keras | MITライセンス |
| 超解像度ガン | 生成的敵対的ネットワークを使用した写真リアルな単一画像超解像度の実装。 | Keras | MITライセンス |
| モデル名 | 説明 | フレームワーク | ライセンス |
|---|---|---|---|
| Detectron2 | Detectron2は、最先端のオブジェクト検出アルゴリズムを実装するFacebook AI Researchの次世代ソフトウェアシステムです | PyTorch | Apacheライセンス2.0 |
| fastphotostyle | 光リアリスティックな画像スタイリゼーションに対する閉じた型ソリューション。 | PyTorch | Creative Commons Attribution-NonCommercial-Sharealike 4.0 International Public Licens |
| pytorch-cyclegan-and-pix2pix | 光リアリスティックな画像スタイリゼーションに対する閉じた型ソリューション。 | PyTorch | BSDライセンス |
| maskrcnnベンチマーク | Pytorchのインスタンスセグメンテーションとオブジェクト検出アルゴリズムの高速でモジュラー参照実装。 | PyTorch | MITライセンス |
| ディープイメージの優先 | ニューラルネットワークによる画像の復元は、学習せずに。 | PyTorch | Apacheライセンス2.0 |
| スターガン | Stargan:マルチドメイン画像から画像への翻訳のための統一された生成官能ネットワーク。 | PyTorch | MITライセンス |
| より速いrcnn.pytorch | このプロジェクトは、より高速なR-CNNオブジェクト検出モデルのトレーニングを加速することを目的とした、より高速なR-CNN実装です。 | PyTorch | MITライセンス |
| pix2pixhd | 条件付きGANで2048x1024の画像を合成および操作します。 | PyTorch | BSDライセンス |
| 拡張器 | 機械学習用のPythonの画像増強ライブラリ。 | PyTorch | MITライセンス |
| アルビュメント | 高速画像増強ライブラリ。 | PyTorch | MITライセンス |
| 深いビデオ分析 | ディープビデオ分析は、ビデオや画像から情報をインデックス作成して抽出するためのプラットフォームです | PyTorch | カスタム |
| セマンティックセグメンテーション-Pytorch | MIT ADE20Kデータセットでのセマンティックセグメンテーション/シーンの解析のためのPytorchの実装。 | PyTorch | BSD 3-Clauseライセンス |
| 画像ベースのシーケンス認識のためのエンドツーエンドトレーニング可能なニューラルネットワーク | このソフトウェアは、シーンテキスト認識やOCRなどの画像ベースのシーケンス認識タスクのCNN、RNN、およびCTC損失の組み合わせである、畳み込み再生ニューラルネットワーク(CRNN)を実装します。 | PyTorch | MITライセンス(MIT) |
| ユニット | 監視されていない画像から画像への翻訳のための結合したVae-GanアルゴリズムのPytorch実装。 | PyTorch | Creative Commons Attribution-NonCommercial-Sharealike 4.0 International Public License |
| ニューラル配列標識モデル | シーケンスラベル付けモデルは、名前付きエンティティ認識(NER)、スピーチ(POS)タグ付け、単語セグメンテーションなど、多くのNLPタスクで非常に人気があります。 | PyTorch | Apacheライセンス |
| より速いRCNN | これは、より高速なRCNNのPytorch実装です。このプロジェクトは、主にPy-Faster-RCNNおよびTFFRCNNに基づいています。 R-CNNの詳細については、R-CNNをより高速に順番に参照してください。ShaoqingRen、Kaiming He、Ross Girshick、Jian SunによるRegion Proposal Networksを使用したリアルタイムオブジェクトの検出に向けて。 | PyTorch | MITライセンス |
| Pytorch-semantic-segmentation | セマンティックセグメンテーションのためのPytorch。 | PyTorch | MITライセンス |
| edsr-pytorch | ペーパーのPytorchバージョン「単一画像の超解像度のための深い残留ネットワークを強化しました」。 | PyTorch | MITライセンス |
| Image-Classification-Mobile | Imagenet-1Kで事前に処理された分類モデルのコレクション。 | PyTorch | MITライセンス |
| Fadernetworks | フェーダーネットワーク:スライディング属性による画像の操作-NIPS 2017。 | PyTorch | Creative Commons Attribution-NonCommercial 4.0国際公開ライセンス |
| NeuralTalk2-Pytorch | Pytorchの画像キャプションモデル(branch with_finetuneのfinetunable cnn)。 | PyTorch | MITライセンス |
| ランドウィレン | 実装:「画像認識のためのランダムに有線のニューラルネットワークの探索」。 | PyTorch | 見つかりません |
| Stackgan-V2 | Stackgan_v2を再現するためのPytorchの実装は、Paper Stackgan ++になります。 | PyTorch | MITライセンス |
| オブジェクト検出のための検出モデル | このコードでは、Pytorchを使用したFacebook AI Researchからのオブジェクト検出のために、Detectronモデルの一部を使用できます。 | PyTorch | Apacheライセンス |
| dextr-pytorch | このペーパーでは、画像やビデオの正確なオブジェクトセグメンテーションを取得するための入力として、オブジェクト(左、右、上部、下部ピクセル)の極端なポイントの使用を調査します。 | PyTorch | GNU一般公開ライセンス |
| Pointnet.pytorch | 「ポイントネット:3D分類とセグメンテーションのポイントセットに関するディープラーニングのPytorch実装。 | PyTorch | MITライセンス |
| selfcritical.pytorch | このリポジトリには、画像キャプションとボトムアップおよび画像キャプションと視覚的な質問応答のトップダウンの注意のための非公式の実装の自己批判的なシーケンストレーニングが含まれています。 | PyTorch | MITライセンス |
| vnet.pytorch | V-NetのPytorch実装:体積医療画像セグメンテーションのための完全畳み込みニューラルネットワーク。 | PyTorch | BSD 3-Clauseライセンス |
| piwise | Pytorchを使用したVOC2012データセットのピクセルごとのセグメンテーション。 | PyTorch | BSD 3-Clauseライセンス |
| pspnet-pytorch | PSPNETセグメンテーションネットワークのPytorch実装。 | PyTorch | 見つかりません |
| pytorch-srresnet | 生成的な敵対的なネットワークを使用した写真 - リアルな単一画像超解像度のためのPytorchの実装。 | PyTorch | MITライセンス(MIT) |
| pnasnet.pytorch | Imagenet上のPNASNET-5のPytorch実装。 | PyTorch | Apacheライセンス |
| img_classification_pk_pytorch | 画像分類モデルを最新モデルとすばやく比較します。 | PyTorch | 見つかりません |
| 深いニューラルネットワークは簡単にだまされます | 認識できない画像の高い信頼予測。 | PyTorch | MITライセンス |
| pix2pix-pytorch | 「条件付き敵対的ネットワークを使用した画像間翻訳」のPytorch実装。 | PyTorch | 見つかりません |
| nvidia/セマンティックセグメンテーション | CVPR2019でのビデオ伝播とラベルリラクゼーションによるセマンティックセグメンテーションの改善に関するPytorchの実装。 | PyTorch | CC by-nc-sa 4.0ライセンス |
| 神経画像評価 | 神経画像評価のPytorch実装。 | PyTorch | 見つかりません |
| torchxrayvision | 胸部X線(CXR)の病理予測の前提型モデル。医療、ヘルスケア、放射線学 | PyTorch | Apacheライセンス |
| pytorch-image-models | Pytorch Image Models、Scripts、Treatrained Weights-(se)resnet/resnext、dpn、efficientnet、mixnet、mobilenet-v3/v2、mnasnet、single-path nas、fbnetなど | PyTorch | Apacheライセンス2.0 |
| モデル名 | 説明 | フレームワーク | ライセンス |
|---|---|---|---|
| OpenPose | OpenPoseは、単一の画像で人体、手、およびフェイシャルキーポイント(合計130のキーポイント)を共同で検出する最初のリアルタイムマルチパーソンシステムを表します。 | Caffe | カスタム |
| セマンティックセグメンテーションのための完全な畳み込みネットワーク | セマンティックセグメンテーションのための完全な畳み込みモデル。 | Caffe | 見つかりません |
| カラフルな画像の色付け | カラフルな画像の色付け。 | Caffe | BSD-2-Clauseライセンス |
| r-fcn | R-FCN:地域ベースの完全畳み込みネットワークを介したオブジェクト検出。 | Caffe | MITライセンス |
| CNN-vis | Googleの最近のInceptionismブログ投稿に触発されたCNN-Visは、畳み込みニューラルネットワークを使用して画像を生成できるオープンソースツールです。 | Caffe | MITライセンス(MIT) |
| deconvnet | セマンティックセグメンテーションのためのデコンボリューションネットワークの学習。 | Caffe | カスタム |
| モデル名 | 説明 | フレームワーク | ライセンス |
|---|---|---|---|
| より速いRCNN | リージョンプロポーザルネットワークは、回帰問題としてオブジェクト検出を解決します。 | MXNet | Apacheライセンス、バージョン2.0 |
| SSD | SSDは、単一のネットワークを使用したオブジェクト検出のための統一されたフレームワークです。 | MXNet | MITライセンス |
| より速いRCNN+焦点損失 | このコードは、密集したオブジェクト検出の焦点損失のための非公式バージョンです。 | MXNet | 見つかりません |
| CNN-LSTM-CTC | 私はテキスト認識のための3つの異なるモデルを実現し、それらはすべて、テキスト画像のセグメンテーションを実現しないためにCTC損失層で構成されています。 | MXNet | 見つかりません |
| faster_rcnn_for_dota | これは、Paper Dotaの公式リポジトリです。空中画像のオブジェクト検出のための大規模なデータセットです。 | MXNet | Apacheライセンス |
| レチナネット | 密なオブジェクト検出の焦点損失。 | MXNet | 見つかりません |
| mobileNetv2 | これは、紙の反転残留物と線形ボトルネックに記載されているように、MobileNETV2アーキテクチャのMXNET実装です:分類、検出、セグメンテーションのためのモバイルネットワーク。 | MXNet | Apacheライセンス |
| ニューロン解選択性移動 | このコードは、あなたが好きなもののような紙のImagenet分類実験の再実装です:知識はニューロン選択性転送を介して蒸留します。 | MXNet | Apacheライセンス |
| mobileNetv2 | これは、紙の反転残留物と線形ボトルネックに記載されているように、MobileNETV2アーキテクチャのグルオン実装です:分類、検出、セグメンテーションのためのモバイルネットワーク。 | MXNet | Apacheライセンス |
| まばらな構造選択 | このコードは、ディープニューラルネットワークのための紙データ駆動型のスパース構造選択におけるImagenet分類実験の再実装です。 | MXNet | Apacheライセンス |
| fastphotostyle | 光リアリスティックな画像スタイリゼーションに対する閉じた型ソリューション。 | MXNet | Creative Commons Attribution-NonCommercial-Sharealike 4.0 International Public License |
あなたの貢献はいつでも大歓迎です!! contributing.mdをご覧ください
MITライセンス