CV pretrained model
Initial Release

預訓練的模型是由其他人創建的模型來解決類似的問題。我們可以將在其他問題上訓練的模型作為起點,而不是從頭開始構建模型來解決類似的問題。預訓練的模型在您的應用程序中可能不准確100%。
例如,如果您想建造自學習車。您可以花費數年的時間從頭開始構建一個體面的圖像識別算法,也可以從Google中採用Inception模型(預訓練的模型),該模型是基於Imagenet數據構建的,以識別這些圖片中的圖像。
您可以使用NetRon看到每個模型網絡體系結構的可視化。

| 模型名稱 | 描述 | 框架 | 執照 |
|---|---|---|---|
| 對象電視 | 在單個圖像中本地化和識別多個對象。 | Tensorflow | Apache許可證 |
| 面具R-CNN | 該模型為圖像中對象的每個實例生成邊界框和分割掩碼。它基於特徵金字塔網絡(FPN)和RESNET101骨幹。 | Tensorflow | 麻省理工學院許可證(MIT) |
| 更快的rcnn | 這是更快的RCNN的實驗張量實現 - 通過區域建議網絡進行對象檢測的轉換。 | Tensorflow | 麻省理工學院許可證 |
| Yolo Tensorflow | 這是Yolo:實時對象檢測的TensorFlow實現。 | Tensorflow | 風俗 |
| Yolo Tensorflow ++ | TensorFlow實現“ YOLO:實時對象檢測”,並在移動設備上進行實時運行,並提供了實際支持。 | Tensorflow | GNU通用公共許可證 |
| Mobilenet | Mobilenets在延遲,大小和準確性之間進行了貿易,同時與文獻的流行模型進行了比較。 | Tensorflow | 麻省理工學院許可證(MIT) |
| Deeplab | 用於語義圖像分割的深標籤。 | Tensorflow | Apache許可證 |
| Colornet | 神經網絡為灰度圖像著色。 | Tensorflow | 未找到 |
| Srgan | 使用生成對抗網絡的照片真實的單圖像超分辨率。 | Tensorflow | 未找到 |
| Deeposm | 帶有OpenStreetMap功能和衛星圖像的訓練Tensorflow神經網。 | Tensorflow | 麻省理工學院許可證(MIT) |
| 域轉移網絡 | 實施無監督的跨域圖像生成。 | Tensorflow | 麻省理工學院許可證 |
| 表演,參加並告訴 | 基於注意力的圖像標題生成器。 | Tensorflow | 麻省理工學院許可證 |
| Android-Yolo | 使用YOLO網絡在Android上進行實時對象檢測,由TensorFlow提供動力。 | Tensorflow | Apache許可證 |
| DCSCN超級分辨率 | 這是“通過跳過連接和網絡在網絡中進行的快速準確圖像超級分辨率的快速,準確的圖像超級分辨率”,這是一個基於深度學習的單片超級分辨率(SISR)模型。 | Tensorflow | 未找到 |
| gan-cls | 這是合成圖像的實驗性張量實現。 | Tensorflow | 未找到 |
| U-net | 用於腦腫瘤分割。 | Tensorflow | 未找到 |
| 改進的自行車 | 未配合的圖像到圖像翻譯。 | Tensorflow | 麻省理工學院許可證 |
| IM2TXT | 圖像字幕的圖像到文本神經網絡。 | Tensorflow | Apache許可證 |
| 苗條的 | TF-SLIM中的圖像分類模型。 | Tensorflow | Apache許可證 |
| 代爾夫 | 圖像匹配和檢索的深度本地功能。 | Tensorflow | Apache許可證 |
| 壓縮 | 使用預訓練的殘留GRU網絡來壓縮和解壓縮圖像。 | Tensorflow | Apache許可證 |
| 注意力運動 | 現實世界圖像文本提取的模型。 | Tensorflow | Apache許可證 |
| 模型名稱 | 描述 | 框架 | 執照 |
|---|---|---|---|
| 面具R-CNN | 該模型為圖像中對象的每個實例生成邊界框和分割掩碼。它基於特徵金字塔網絡(FPN)和RESNET101骨幹。 | Keras | 麻省理工學院許可證(MIT) |
| VGG16 | 非常深的捲積網絡,用於大規模圖像識別。 | Keras | 麻省理工學院許可證(MIT) |
| VGG19 | 非常深的捲積網絡,用於大規模圖像識別。 | Keras | 麻省理工學院許可證(MIT) |
| 重新連接 | 深層剩餘的學習圖像識別。 | Keras | 麻省理工學院許可證(MIT) |
| RESNET50 | 深層剩餘的學習圖像識別。 | Keras | 麻省理工學院許可證(MIT) |
| Nasnet | NASNET是指神經體系結構搜索網絡,這是一個模型家族,是通過直接在感興趣的數據集中學習模型體系結構來自動設計的。 | Keras | 麻省理工學院許可證(MIT) |
| Mobilenet | Mobilenet V1模型。 | Keras | 麻省理工學院許可證(MIT) |
| Mobilenet V2 | Keras的Mobilenet V2模型。 | Keras | 麻省理工學院許可證(MIT) |
| Mobilenet V3 | Mobilenet V3模型。 | Keras | 麻省理工學院許可證(MIT) |
| 有效網絡 | 重新思考卷積神經網絡的模型縮放。 | Keras | 麻省理工學院許可證(MIT) |
| 圖像類比 | 使用神經匹配和混合產生圖像類比。 | Keras | 麻省理工學院許可證(MIT) |
| 流行的圖像分割模型 | KERAS中塞格內特,FCN,UNET和其他模型的實現。 | Keras | 麻省理工學院許可證 |
| 超聲神經分割 | 本教程展示瞭如何使用KERAS庫來構建深度神經網絡以進行超聲圖像神經分割。 | Keras | 麻省理工學院許可證 |
| DeepMask對象分割 | 這是一個基於卡拉斯的Python實現DeepMask-用於學習對象分割掩模的複雜的深神經網絡。 | Keras | 未找到 |
| 單語和多語言圖像字幕 | 這是帶有神經序列模型的多語言圖像描述伴隨的源代碼。 | Keras | BSD-3-CAREASE許可證 |
| PIX2PIX | 菲利普·索拉(Phillip Isela),朱尼(Jun-Yan)朱(Jun-Yan Zhu),廷霍伊(Tinghui Zhou),alexei A. | Keras | 未找到 |
| 彩色圖像著色 | B&W顏色。 | Keras | 未找到 |
| 自行車 | 使用循環一致的對抗網絡實施未配對的圖像到圖像翻譯。 | Keras | 麻省理工學院許可證 |
| dualgan | Dualgan的實現:圖像到圖像翻譯的無監督雙學習。 | Keras | 麻省理工學院許可證 |
| 超分辨率gan | 使用生成對抗網絡實現照片真實的單圖像超分辨率。 | Keras | 麻省理工學院許可證 |
| 模型名稱 | 描述 | 框架 | 執照 |
|---|---|---|---|
| 檢測2 | Dentectron2是Facebook AI Research的下一代軟件系統,它實現了最先進的對象檢測算法 | PyTorch | Apache許可證2.0 |
| Fastphotostyle | 封閉形式的逼真的圖像樣式化的解決方案。 | PyTorch | 創意共享歸因非商業共享4.0國際公共許可 |
| pytorch-cyclegan and-pix2pix | 封閉形式的逼真的圖像樣式化的解決方案。 | PyTorch | BSD許可證 |
| maskrcnn基準 | pytorch中實例分割和對象檢測算法的快速模塊化參考實現。 | PyTorch | 麻省理工學院許可證 |
| 深圖像優點 | 通過神經網絡恢復圖像,但沒有學習。 | PyTorch | Apache許可證2.0 |
| Stargan | Stargan:用於多域圖像到圖像翻譯的統一生成對抗網絡。 | PyTorch | 麻省理工學院許可證 |
| 更快的rcnn.pytorch | 該項目是更快的R-CNN實現速度,旨在加快更快的R-CNN對象檢測模型的訓練。 | PyTorch | 麻省理工學院許可證 |
| pix2pixhd | 與條件gan的合成和操縱2048x1024圖像。 | PyTorch | BSD許可證 |
| 增強器 | Python中的圖像增強庫,用於機器學習。 | PyTorch | 麻省理工學院許可證 |
| 符號 | 快速圖像增強庫。 | PyTorch | 麻省理工學院許可證 |
| 深度視頻分析 | Deep Video Analytics是一個平台,用於索引和從視頻和圖像中提取信息 | PyTorch | 風俗 |
| 語義細分式 - 托爾奇 | MIT ADE20K數據集上的語義細分/場景解析的Pytorch實現。 | PyTorch | BSD 3條規定許可證 |
| 用於基於圖像序列識別的端到端可訓練的神經網絡 | 該軟件實現了基於圖像的序列識別任務(例如場景文本識別和OCR)的CNN,RNN和CTC丟失的捲積復發性神經網絡(CRNN)。 | PyTorch | 麻省理工學院許可證(MIT) |
| 單元 | 用於無監督圖像到圖像翻譯的耦合vae-gan算法的pytorch實現。 | PyTorch | 創意共享歸因非商業共享4.0國際公共許可證 |
| 神經序列標記模型 | 序列標記模型在許多NLP任務中都很流行,例如命名實體識別(NER),言論部分(POS)標記和單詞分段。 | PyTorch | Apache許可證 |
| 更快的rcnn | 這是更快的RCNN的Pytorch實現。該項目主要基於py-faster-rcnn和tffrcnn。有關R-CNN的詳細信息,請參考更快的R-CNN紙張:通過Shaoqing Ren,Kaiming He,Ross Girshick,Jian Sun的Shaoqing Ren進行實時對象檢測。 | PyTorch | 麻省理工學院許可證 |
| pytorch語義細分 | 用於語義分割的pytorch。 | PyTorch | 麻省理工學院許可證 |
| Edsr-Pytorch | Pytorch版本的“增強了單個圖像超分辨率的增強的深度殘留網絡”。 | PyTorch | 麻省理工學院許可證 |
| 圖像分類模型 | 在Imagenet-1k上預估計的分類模型的收集。 | PyTorch | 麻省理工學院許可證 |
| Fadernetworks | 推子網絡:通過滑動屬性來操縱圖像-NIPS 2017。 | PyTorch | 創意共享歸因非商業4.0國際公共許可證 |
| NeuralTalk2-Pytorch | pytorch中的圖像字幕模型(帶有_Finetune的分支中的可烯可CNN)。 | PyTorch | 麻省理工學院許可證 |
| Randwirenn | 實施:“探索隨機有線神經網絡以識別圖像識別”。 | PyTorch | 未找到 |
| Stackgan-V2 | 用於復制Stackgan_v2的Pytorch實現會導致紙張Stackgan ++。 | PyTorch | 麻省理工學院許可證 |
| 檢測對象檢測的模型 | 該代碼允許使用Pytorch從Facebook AI研究中使用一些檢測模型來檢測對象。 | PyTorch | Apache許可證 |
| dextr-pytorch | 本文探討了對象(左,最右,頂部,底部像素)中極端點的使用,以獲取圖像和視頻的精確對象分割。 | PyTorch | GNU通用公共許可證 |
| pointnet.pytorch | Pytorch實現“ PointNet:3D分類和分割的點集深度學習。 | PyTorch | 麻省理工學院許可證 |
| pytorch | 該存儲庫包括圖像字幕的非官方實施自我批評序列訓練,以及自下而上的圖像字幕和視覺詢問回答的自下而上和自上而下的注意力。 | PyTorch | 麻省理工學院許可證 |
| vnet.pytorch | V-NET的Pytorch實現:用於體積醫學圖像分割的完全卷積神經網絡。 | PyTorch | BSD 3條規定許可證 |
| piwise | 使用Pytorch在VOC2012數據集上的像素細分。 | PyTorch | BSD 3條規定許可證 |
| pspnet-pytorch | PSPNET分割網絡的Pytorch實現。 | PyTorch | 未找到 |
| pytorch-srresnet | Pytorch實現了使用生成對抗網絡的光真實單圖像超分辨率的實現。 | PyTorch | 麻省理工學院許可證(MIT) |
| pnasnet.pytorch | PNASNET-5在Imagenet上實現Pytorch。 | PyTorch | Apache許可證 |
| img_classification_pk_pytorch | 快速將您的圖像分類模型與最新模型進行比較。 | PyTorch | 未找到 |
| 深度神經網絡很容易被愚弄 | 對無法識別的圖像的高置信度預測。 | PyTorch | 麻省理工學院許可證 |
| PIX2PIX-PYTORCH | Pytorch實現“使用條件對抗網絡的圖像到圖像翻譯”。 | PyTorch | 未找到 |
| NVIDIA/語義細分 | CVPR2019中,通過視頻傳播和標籤放鬆改善語義分割的Pytorch實施。 | PyTorch | CC BY-NC-SA 4.0許可證 |
| 神經圖像評估 | 神經圖像評估的Pytorch實施。 | PyTorch | 未找到 |
| Torchxrayvision | 胸部X射線(CXR)病理學預測的預處理模型。醫療,醫療保健,放射學 | PyTorch | Apache許可證 |
| Pytorch-image模型 | Pytorch映像模型,腳本,預處理的重量 - (SE)RESNET/RESNET,DPN,EFIDENDNET,MIXENET,MOBILENET-V3/V2,MNASNET,MNASNET,SINSE-PATH NAS,FBNET等 | PyTorch | Apache許可證2.0 |
| 模型名稱 | 描述 | 框架 | 執照 |
|---|---|---|---|
| 敞開 | OpenPose代表了單個圖像上共同檢測人體,手和麵部關鍵點(總計130個關鍵點)的第一個實時多人系統。 | Caffe | 風俗 |
| 完全卷積網絡用於語義細分 | 完全卷積的語義分割模型。 | Caffe | 未找到 |
| 彩色圖像著色 | 彩色圖像著色。 | Caffe | BSD-2-CAREASE許可證 |
| R-FCN | R-FCN:通過基於區域的完全卷積網絡進行對象檢測。 | Caffe | 麻省理工學院許可證 |
| CNN-VIS | 受Google最近的Intectionism博客文章的啟發,CNN-VIS是一種開源工具,可讓您使用卷積神經網絡來生成圖像。 | Caffe | 麻省理工學院許可證(MIT) |
| deconvnet | 學習語義細分的解卷積網絡。 | Caffe | 風俗 |
| 模型名稱 | 描述 | 框架 | 執照 |
|---|---|---|---|
| 更快的rcnn | 區域建議網絡將對象檢測求解為回歸問題。 | MXNet | Apache許可證,版本2.0 |
| SSD | SSD是使用單個網絡進行對象檢測的統一框架。 | MXNet | 麻省理工學院許可證 |
| 更快的RCNN+局灶性損失 | 該代碼是緻密對象檢測的焦點損失的非官方版本。 | MXNet | 未找到 |
| CNN-LSTM-CTC | 我意識到了三種不同的文本識別模型,所有模型都由CTC損耗層組成,以實現文本圖像的細分。 | MXNet | 未找到 |
| laster_rcnn_for_dota | 這是Paper Dota的官方存儲庫:一個大型數據集,用於空中圖像中的對象檢測。 | MXNet | Apache許可證 |
| 視網膜 | 密集對象檢測的焦點損失。 | MXNet | 未找到 |
| Mobilenetv2 | 這是MobileNetV2架構的MXNET實現,如論文倒置殘差和線性瓶頸中所述:用於分類,檢測和分割的移動網絡。 | MXNet | Apache許可證 |
| 神經元選擇性轉移 | 該代碼是本文中的成像類分類實驗的重新實現,就像您喜歡的內容:通過神經元的選擇性轉移知識蒸餾。 | MXNet | Apache許可證 |
| Mobilenetv2 | 如論文倒置的殘差和線性瓶頸:用於分類,檢測和分割的移動網絡,這是Mobilenetv2架構的GLUON實現。 | MXNet | Apache許可證 |
| 稀疏結構選擇 | 該代碼是對深神經網絡的紙數據驅動的稀疏結構選擇中的成像類分類實驗的重新實現。 | MXNet | Apache許可證 |
| Fastphotostyle | 封閉形式的逼真的圖像樣式化的解決方案。 | MXNet | 創意共享歸因非商業共享4.0國際公共許可證 |
總是歡迎您的貢獻! !請看一下contributing.md
麻省理工學院許可證