
Un modèle pré-formé est un modèle créé par quelqu'un d'autre pour résoudre un problème similaire. Au lieu de construire un modèle à partir de zéro pour résoudre un problème similaire, nous pouvons utiliser le modèle formé sur un autre problème comme point de départ. Un modèle pré-formé peut ne pas être précis à 100% dans votre application.
Par exemple, si vous souhaitez construire une voiture d'auto-apprentissage. Vous pouvez passer des années pour construire un algorithme de reconnaissance d'image décent à partir de zéro ou vous pouvez prendre un modèle de conception (un modèle pré-formé) de Google qui a été construit sur les données ImageNet pour identifier les images dans ces images.
Vous pouvez voir des visualisations de l'architecture de réseau de chaque modèle en utilisant Nettron.

| Nom du modèle | Description | Cadre | Licence |
|---|---|---|---|
| Objet | Localiser et identifier plusieurs objets dans une seule image. | Tensorflow | Licence Apache |
| Masque r-cnn | Le modèle génère des boîtes de délimitation et des masques de segmentation pour chaque instance d'un objet dans l'image. Il est basé sur Feature Pyramid Network (FPN) et une squelette RESNET101. | Tensorflow | La licence du MIT (MIT) |
| RCNN plus rapide | Il s'agit d'une implémentation expérimentale TensorFlow de RCNN plus rapide - un convnet pour la détection d'objets avec un réseau de propositions régional. | Tensorflow | Licence MIT |
| Yolo Tensorflow | Il s'agit de l'implémentation TensorFlow du YOLO: détection d'objets en temps réel. | Tensorflow | Coutume |
| YOLO TENSORFLOW ++ | Implémentation de Tensorflow de «Yolo: Détection d'objets en temps réel», avec une formation et un support réel pour l'exécution en temps réel sur les appareils mobiles. | Tensorflow | Licence publique générale GNU |
| Mobilenet | Les mobilenets échangent entre la latence, la taille et la précision tout en comparant favorablement avec les modèles populaires de la littérature. | Tensorflow | La licence du MIT (MIT) |
| Profondeur | Étiquetage profond pour la segmentation d'image sémantique. | Tensorflow | Licence Apache |
| Colornet | Réseau neuronal pour colorer les images en niveaux de gris. | Tensorflow | Pas trouvé |
| Srgan | Super-résolution d'image unique photo-réaliste à l'aide d'un réseau adversaire génératif. | Tensorflow | Pas trouvé |
| Profondeur | Faire des filets neuronaux TensorFlow avec des caractéristiques OpenStreetMap et des images satellites. | Tensorflow | La licence du MIT (MIT) |
| Réseau de transfert de domaine | Implémentation de la génération d'images inter-domaines non supervisée. | Tensorflow | Licence MIT |
| Montrer, assister et dire | Générateur de légende d'image basé sur l'attention. | Tensorflow | Licence MIT |
| Android-Yolo | Détection d'objets en temps réel sur Android à l'aide du réseau YOLO, alimenté par TensorFlow. | Tensorflow | Licence Apache |
| Super résolution DCSCN | Il s'agit d'une implémentation TensorFlow de la "super résolution d'image rapide et précise par Deep CNN avec la connexion Skip et le réseau dans le réseau", un modèle de super-résolution unique (SISR) basé sur l'apprentissage en profondeur (SISR). | Tensorflow | Pas trouvé |
| Gan-cls | Il s'agit d'une implémentation expérimentale TensorFlow des images de synthèse. | Tensorflow | Pas trouvé |
| U-net | Pour la segmentation des tumeurs cérébrales. | Tensorflow | Pas trouvé |
| Cyclegan amélioré | Image non appariée à la traduction d'image. | Tensorflow | Licence MIT |
| Im2txt | Réseau neuronal d'image à texte pour le sous-titrage de l'image. | Tensorflow | Licence Apache |
| MINCE | Modèles de classification d'images dans TF-SLIM. | Tensorflow | Licence Apache |
| Se faire cuire | Fonctionnalités locales profondes pour la correspondance et la récupération d'images. | Tensorflow | Licence Apache |
| Compression | Comprimer et décompresser les images à l'aide d'un réseau GRU résiduel pré-formé. | Tensorflow | Licence Apache |
| Attention | Un modèle d'extraction de texte d'image du monde réel. | Tensorflow | Licence Apache |
| Nom du modèle | Description | Cadre | Licence |
|---|---|---|---|
| Masque r-cnn | Le modèle génère des boîtes de délimitation et des masques de segmentation pour chaque instance d'un objet dans l'image. Il est basé sur Feature Pyramid Network (FPN) et une squelette RESNET101. | Keras | La licence du MIT (MIT) |
| VGG16 | Réseaux convolutionnels très profonds pour la reconnaissance d'images à grande échelle. | Keras | La licence du MIT (MIT) |
| VGG19 | Réseaux convolutionnels très profonds pour la reconnaissance d'images à grande échelle. | Keras | La licence du MIT (MIT) |
| Resnet | Apprentissage résiduel profond pour la reconnaissance d'image. | Keras | La licence du MIT (MIT) |
| Resnet50 | Apprentissage résiduel profond pour la reconnaissance d'image. | Keras | La licence du MIT (MIT) |
| Nasnet | NASNET fait référence au réseau de recherche d'architecture neuronale, une famille de modèles qui ont été conçus automatiquement en apprenant les architectures de modèle directement sur l'ensemble de données d'intérêt. | Keras | La licence du MIT (MIT) |
| Mobilenet | MOBILENET V1 MODÈLES POUR KERAS. | Keras | La licence du MIT (MIT) |
| Mobilenet v2 | MOBILENET V2 MODÈLES POUR KERAS. | Keras | La licence du MIT (MIT) |
| Mobilenet v3 | Modèles Mobilenet V3 pour Keras. | Keras | La licence du MIT (MIT) |
| efficace | Repenser la mise à l'échelle du modèle pour les réseaux de neurones convolutionnels. | Keras | La licence du MIT (MIT) |
| Analogies d'image | Générez des analogies d'image en utilisant la correspondance et le mélange neuronaux. | Keras | La licence du MIT (MIT) |
| Modèles de segmentation d'images populaires | Implémentation de Segnet, FCN, UNET et d'autres modèles dans Keras. | Keras | Licence MIT |
| Segmentation du nerf échographique | Ce tutoriel montre comment utiliser la bibliothèque Keras pour construire un réseau neuronal profond pour la segmentation nerveuse de l'image à ultrasons. | Keras | Licence MIT |
| Segmentation des objets Deepmask | Il s'agit d'une implémentation Python basée sur des keras de Deepmask - un réseau neuronal profond complexe pour l'apprentissage des masques de segmentation d'objets. | Keras | Pas trouvé |
| Centionnement d'image monolingue et multilingue | Il s'agit du code source qui accompagne la description d'image multilingue avec des modèles de séquence neuronale. | Keras | Licence de clause BSD-3 |
| pix2pix | Implémentation de Keras de la traduction de l'image à l'image avec des réseaux adversaires conditionnels par Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. | Keras | Pas trouvé |
| Colorisation d'image colorée | B&W à colorer. | Keras | Pas trouvé |
| Cycle de cycle | Mise en œuvre de la traduction d'image à image non appariée à l'aide de réseaux contradictoires cohérents . | Keras | Licence MIT |
| Dualgan | Implémentation de Dualgan: Double apprentissage non supervisé pour la traduction d'image à image . | Keras | Licence MIT |
| Gan super-résolution | Implémentation de super-résolution d'image unique photo-réaliste à l'aide d'un réseau adversaire génératif . | Keras | Licence MIT |
| Nom du modèle | Description | Cadre | Licence |
|---|---|---|---|
| Detectron2 | Detectron2 est le système logiciel de prochaine génération de Facebook AI Research qui met en œuvre des algorithmes de détection d'objets de pointe | PyTorch | Licence Apache 2.0 |
| Fastphotostyle | Une solution de forme fermée à la stylisation d'images photoréalistes. | PyTorch | Creative Commons Attribution-NonCommercial-Sharealike 4.0 International Public Licens |
| pytorch-cyclegan et pix2pix | Une solution de forme fermée à la stylisation d'images photoréalistes. | PyTorch | Licence BSD |
| maskrcnn-benchmark | Implémentation de référence modulaire rapide de la segmentation des instances et des algorithmes de détection d'objets dans Pytorch. | PyTorch | Licence MIT |
| Image profond | Restauration d'image avec des réseaux de neurones mais sans apprentissage. | PyTorch | Licence Apache 2.0 |
| Stargan | Stargan: réseaux adversaires génératifs unifiés pour la traduction d'image à images multi-domaines. | PyTorch | Licence MIT |
| plus rapide-rcn.pytorch | Ce projet est une implémentation R-CNN plus rapide plus rapide, visant à accélérer la formation de modèles de détection d'objets R-CNN plus rapides. | PyTorch | Licence MIT |
| pix2pixhd | Synthèse et manipulant les images 2048x1024 avec des Gans conditionnels. | PyTorch | Licence BSD |
| Augmentateur | Bibliothèque d'augmentation d'image dans Python pour l'apprentissage automatique. | PyTorch | Licence MIT |
| albumentations | Bibliothèque d'augmentation d'image rapide. | PyTorch | Licence MIT |
| Analyse vidéo profonde | Deep Video Analytics est une plate-forme d'indexation et d'extraction d'informations à partir de vidéos et d'images | PyTorch | Coutume |
| segment-segmentation-pytorch | Implémentation de Pytorch pour la segmentation sémantique / analyse de scène sur l'ensemble de données MIT ADE20K. | PyTorch | Licence BSD 3-CLAUSE |
| Un réseau neuronal formable de bout en bout pour la reconnaissance de séquences basée sur l'image | Ce logiciel met en œuvre le réseau neuronal récurrent convolutionnel (CRNN), une combinaison de la perte CNN, RNN et CTC pour les tâches de reconnaissance de séquences basées sur l'image, telles que la reconnaissance de texte de scène et l'OCR. | PyTorch | La licence du MIT (MIT) |
| UNITÉ | Pytorch Implémentation de notre algorithme VAE-GAN couplé pour la traduction d'image à image non supervisée. | PyTorch | Creative Commons Attribution-noncommercial-Sharealike 4.0 Licence publique internationale |
| Modèle de marquage de séquence neurale | Les modèles de marquage de séquence sont très populaires dans de nombreuses tâches PNL, telles que la reconnaissance des entités nommées (NER), le marquage de la partie du discours (POS) et la segmentation des mots. | PyTorch | Licence Apache |
| RCNN plus rapide | Il s'agit d'une implémentation Pytorch de RCNN plus rapide. Ce projet est principalement basé sur PY-Faster-RCNN et TFFRCNN. Pour plus de détails sur R-CNN, veuillez vous référer au document plus rapide R-CNN: Vers la détection d'objets en temps réel avec les réseaux de proposition de région par Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun. | PyTorch | Licence MIT |
| segmentation pytorch-sémantique | Pytorch pour la segmentation sémantique. | PyTorch | Licence MIT |
| Edsr-pytorch | Version Pytorch du papier «Réseaux résiduels profonds améliorés pour la super-résolution d'image unique». | PyTorch | Licence MIT |
| Image-classification-mobile | Collection de modèles de classification pré-entraînés sur l'imageNet-1k. | PyTorch | Licence MIT |
| Fadernetworks | Fader Networks: Manipuler les images par des attributs coulissants - NIPS 2017. | PyTorch | Creative Commons Attribution-NonCommercial 4.0 Licence publique internationale |
| NeuralTalk2-Pytorch | Modèle de sous-titrage de l'image dans Pytorch (CNN finetunable dans la branche avec_finetune). | PyTorch | Licence MIT |
| Randwirenn | Implémentation de: "Exploration des réseaux de neurones câblés au hasard pour la reconnaissance d'image". | PyTorch | Pas trouvé |
| Stackgan-V2 | L'implémentation de Pytorch pour la reproduction de Stackgan_v2 entraîne le papier Stackgan ++. | PyTorch | Licence MIT |
| Modèles de détection de détection pour la détection d'objets | Ce code permet d'utiliser certains des modèles Detectron pour la détection d'objets à partir de Facebook AI Research avec Pytorch. | PyTorch | Licence Apache |
| Dextr-pytorch | Cet article explore l'utilisation de points extrêmes dans un objet (pixels le plus à droite, supérieur, supérieur et inférieur) en entrée pour obtenir une segmentation d'objet précise pour les images et les vidéos. | PyTorch | Licence publique générale GNU |
| PointNet.pytorch | Implémentation de Pytorch pour "PointNet: apprentissage en profondeur sur les ensembles de points pour la classification et la segmentation 3D. | PyTorch | Licence MIT |
| autocritique.pytorch | Ce référentiel comprend la formation non officielle de la séquence autocritique de mise en œuvre pour le sous-titrage d'image et l'attention de bas en haut et de haut en bas pour le sous-titrage de l'image et la réponse aux questions visuelles. | PyTorch | Licence MIT |
| vnet.pytorch | Une implémentation Pytorch pour V-Net: réseaux neuronaux entièrement convolutionnels pour la segmentation volumétrique de l'image médicale. | PyTorch | Licence BSD 3-CLAUSE |
| piwise | Segmentation par pixel sur le jeu de données VOC2012 à l'aide de pytorch. | PyTorch | Licence BSD 3-CLAUSE |
| pspnet-pytorch | Implémentation Pytorch du réseau de segmentation PSPNET. | PyTorch | Pas trouvé |
| pytorch-srresnet | Implémentation de Pytorch pour une super-résolution d'image unique photo-réaliste à l'aide d'un réseau adversaire génératif. | PyTorch | La licence du MIT (MIT) |
| Pnasnet.pytorch | Implémentation Pytorch de PNASNET-5 sur ImageNet. | PyTorch | Licence Apache |
| img_classification_pk_pytorch | En comparant rapidement vos modèles de classification d'image avec les modèles de pointe. | PyTorch | Pas trouvé |
| Les réseaux de neurones profonds sont facilement dupés | Prédictions de confiance élevée pour les images méconnaissables. | PyTorch | Licence MIT |
| pix2pix-pytorch | Implémentation Pytorch de "traduction d'image à l'image à l'aide de réseaux adversaires conditionnels". | PyTorch | Pas trouvé |
| Nvidia / segmentation sémantique | Une mise en œuvre pytorch de l'amélioration de la segmentation sémantique via la propagation vidéo et la relaxation des étiquettes, dans CVPR2019. | PyTorch | Licence CC BYC-SA 4.0 |
| Évaluation de l'image neurale | Une mise en œuvre pytorch de l'évaluation de l'image neuronale. | PyTorch | Pas trouvé |
| torchxrayvision | Modèles pré-entraînés pour les prédictions de pathologie à rayons X thoraciques (CXR). Médical, soins de santé, radiologie | PyTorch | Licence Apache |
| pytorch-image-modèles | Modèles d'image Pytorch, scripts, poids pré-entraînés - (SE) Resnet / Resnext, DPN, EfficientNet, Mixnet, MobileNet-V3 / V2, MNASNET, NAS à PATH unique, FBNET, et plus encore | PyTorch | Licence Apache 2.0 |
| Nom du modèle | Description | Cadre | Licence |
|---|---|---|---|
| Ouverte | OpenPose représente le premier système multi-personnes en temps réel pour détecter conjointement le corps humain, la main et les points clés du visage (en 130 points clés) sur des images uniques. | Caffe | Coutume |
| Réseaux entièrement convolutionnels pour la segmentation sémantique | Modèles entièrement convolutionnels pour la segmentation sémantique. | Caffe | Pas trouvé |
| Colorisation d'image colorée | Colorisation d'image colorée. | Caffe | Licence de clause BSD-2 |
| R-fcn | R-FCN: Détection d'objets via des réseaux entièrement convolutionnels entièrement basés sur la région. | Caffe | Licence MIT |
| cnn-vis | Inspiré par le récent article de blog de la création de Google, CNN-Vis est un outil open-source qui vous permet d'utiliser des réseaux de neurones convolutionnels pour générer des images. | Caffe | La licence du MIT (MIT) |
| Déconvnet | Apprentissage du réseau de déconvolution pour la segmentation sémantique. | Caffe | Coutume |
| Nom du modèle | Description | Cadre | Licence |
|---|---|---|---|
| RCNN plus rapide | Le réseau de proposition de région résout la détection d'objets comme problème de régression. | MXNet | Licence Apache, version 2.0 |
| SSD | SSD est un cadre unifié pour la détection d'objets avec un seul réseau. | MXNet | Licence MIT |
| RCNN plus rapide + perte focale | Le code est une version non officielle pour une perte focale pour la détection d'objets dense. | MXNet | Pas trouvé |
| CNN-LSTM-CTC | Je me rends compte de trois modèles différents de reconnaissance de texte, et tous se composent de couche de perte CTC pour ne réaliser aucune segmentation pour les images de texte. | MXNet | Pas trouvé |
| Plus rapide_rcnn_for_dota | Ceci est le dépôt officiel du papier DOTA: un ensemble de données à grande échelle pour la détection d'objets dans des images aériennes . | MXNet | Licence Apache |
| Rétinanet | Perte focale pour la détection d'objets dense. | MXNet | Pas trouvé |
| Mobilenetv2 | Il s'agit d'une implémentation MXNET de l'architecture MobileNetv2 comme décrit dans les résidus inversés du papier et les goulots d'étranglement linéaires: réseaux mobiles pour la classification, la détection et la segmentation . | MXNet | Licence Apache |
| transfert de neurone-sélectivité | Ce code est une réimplémentation des expériences de classification ImageNet dans l'article comme ce que vous aimez: les connaissances distillent via le transfert de sélectivité des neurones . | MXNet | Licence Apache |
| Mobilenetv2 | Il s'agit d'une implémentation Gluon de l'architecture MobileNetv2 comme décrit dans les résidus inversés du papier et les goulots d'étranglement linéaires: réseaux mobiles pour la classification, la détection et la segmentation . | MXNet | Licence Apache |
| sélection de structure clairsemée | Ce code est une réimplémentation des expériences de classification ImageNet dans la sélection de structure clairsemée basée sur les données pour les réseaux de neurones profonds . | MXNet | Licence Apache |
| Fastphotostyle | Une solution de forme fermée à la stylisation d'images photoréalistes. | MXNet | Creative Commons Attribution-noncommercial-Sharealike 4.0 Licence publique internationale |
Vos contributions sont toujours les bienvenues !! Veuillez consulter contributing.md
Licence MIT