
Un modelo previamente capacitado es un modelo creado por alguien más para resolver un problema similar. En lugar de construir un modelo desde cero para resolver un problema similar, podemos usar el modelo entrenado en otro problema como punto de partida. Un modelo previamente capacitado puede no ser 100% preciso en su aplicación.
Por ejemplo, si desea construir un auto de aprendizaje automático. Puede pasar años para construir un algoritmo de reconocimiento de imagen decente desde cero o puede tomar el modelo de inicio (un modelo previamente capacitado) de Google que se basó en datos de Imagenet para identificar imágenes en esas imágenes.
Puede ver visualizaciones de la arquitectura de red de cada modelo utilizando Netron.

| Nombre del modelo | Descripción | Estructura | Licencia |
|---|---|---|---|
| Detección de objetos | Localización e identificación de múltiples objetos en una sola imagen. | Tensorflow | Licencia de apache |
| Máscara R-CNN | El modelo genera cuadros delimitadores y máscaras de segmentación para cada instancia de un objeto en la imagen. Se basa en Feature Pyramid Network (FPN) y una columna vertebral resnet101. | Tensorflow | La licencia del MIT (MIT) |
| Rcnn más rápido | Esta es una implementación experimental de flujo de tensor de RCNN más rápido: un convet de convetidos para la detección de objetos con una red de propuestas de región. | Tensorflow | Licencia de MIT |
| Yolo tensorflow | Esta es la implementación de TensorFlow de Yolo: detección de objetos en tiempo real. | Tensorflow | Costumbre |
| Yolo tensorflow ++ | Implementación de TensorFlow de 'Yolo: detección de objetos en tiempo real', con capacitación y un soporte real para la ejecución en tiempo real en dispositivos móviles. | Tensorflow | Licencia pública general de GNU |
| Mobilenet | MobileNets intercambia entre latencia, tamaño y precisión mientras se comparan favorablemente con los modelos populares de la literatura. | Tensorflow | La licencia del MIT (MIT) |
| Piloto profundo | Etiquetado profundo para la segmentación de imágenes semánticas. | Tensorflow | Licencia de apache |
| Colornet | Red neuronal para colorear imágenes en escala de grises. | Tensorflow | Extraviado |
| Srgan | SUPER-RESOLUCIÓN Photo-Realista SUPERACIÓN UTILIZANDO una red adversaria generativa. | Tensorflow | Extraviado |
| Profundo | Train TensorFlow Nets Neural con características de OpenStreetMap y imágenes satelitales. | Tensorflow | La licencia del MIT (MIT) |
| Red de transferencia de dominio | Implementación de la generación de imágenes de dominio cruzado no supervisado. | Tensorflow | Licencia de MIT |
| Mostrar, asistir y contar | Generador de subtítulos de imagen basado en la atención. | Tensorflow | Licencia de MIT |
| Android-yolo | Detección de objetos en tiempo real en Android usando la red Yolo, alimentada por TensorFlow. | Tensorflow | Licencia de apache |
| DCSCN Super Resolución | Esta es una implementación de TensorFlow de "Super resolución de imagen rápida y precisa por CNN profunda con conexión de omisión y red en la red", un modelo de super-resolución (SISR) basado en el aprendizaje profundo (SISR). | Tensorflow | Extraviado |
| Gan-cls | Esta es una implementación experimental de flujo de tensor de imágenes de sintetización. | Tensorflow | Extraviado |
| Net | Para la segmentación del tumor cerebral. | Tensorflow | Extraviado |
| Cyclegan mejorado | Imagen no apareada a la traducción de la imagen. | Tensorflow | Licencia de MIT |
| Im2txt | Red neural de imagen a texto para subtítulos de imágenes. | Tensorflow | Licencia de apache |
| DELGADO | Modelos de clasificación de imágenes en TF-Slim. | Tensorflow | Licencia de apache |
| Matón | Características locales profundas para la coincidencia y recuperación de imágenes. | Tensorflow | Licencia de apache |
| Compresión | Comprimir y descomprimir imágenes utilizando una red GRU residual previamente entrenada. | Tensorflow | Licencia de apache |
| Atención | Un modelo para extracción de texto de imagen del mundo real. | Tensorflow | Licencia de apache |
| Nombre del modelo | Descripción | Estructura | Licencia |
|---|---|---|---|
| Máscara R-CNN | El modelo genera cuadros delimitadores y máscaras de segmentación para cada instancia de un objeto en la imagen. Se basa en Feature Pyramid Network (FPN) y una columna vertebral resnet101. | Keras | La licencia del MIT (MIT) |
| VGG16 | Redes convolucionales muy profundas para el reconocimiento de imágenes a gran escala. | Keras | La licencia del MIT (MIT) |
| VGG19 | Redes convolucionales muy profundas para el reconocimiento de imágenes a gran escala. | Keras | La licencia del MIT (MIT) |
| Resnet | Aprendizaje residual profundo para el reconocimiento de imágenes. | Keras | La licencia del MIT (MIT) |
| Resnet50 | Aprendizaje residual profundo para el reconocimiento de imágenes. | Keras | La licencia del MIT (MIT) |
| Nasnet | Nasnet se refiere a la red de búsqueda de arquitectura neural, una familia de modelos que se diseñaron automáticamente al aprender las arquitecturas de modelos directamente en el conjunto de datos de interés. | Keras | La licencia del MIT (MIT) |
| Mobilenet | Modelos Mobilenet V1 para Keras. | Keras | La licencia del MIT (MIT) |
| Mobilenet V2 | Modelos Mobilenet V2 para Keras. | Keras | La licencia del MIT (MIT) |
| Mobilenet V3 | Modelos MobileNet V3 para Keras. | Keras | La licencia del MIT (MIT) |
| EficeTnet | Repensar la escala del modelo para redes neuronales convolucionales. | Keras | La licencia del MIT (MIT) |
| Analogías de imagen | Genere analogías de imagen utilizando la coincidencia neural y la mezcla. | Keras | La licencia del MIT (MIT) |
| Modelos populares de segmentación de imágenes | Implementación de Segnet, FCN, UNET y otros modelos en Keras. | Keras | Licencia de MIT |
| Segmentación nerviosa de ultrasonido | Este tutorial muestra cómo usar la biblioteca Keras para construir una red neuronal profunda para la segmentación del nervio de la imagen de ultrasonido. | Keras | Licencia de MIT |
| Segmentación de objetos de la máscara profunda | Esta es una implementación de Python basada en Keras de Deepmask, una red neuronal profunda compleja para aprender máscaras de segmentación de objetos. | Keras | Extraviado |
| Subtítulos de imágenes monolingües y multilingües | Este es el código fuente que acompaña a la descripción de la imagen multilingüe con modelos de secuencia neural. | Keras | Licencia de cláusula BSD-3 |
| pix2pix | Implementación de Keras de traducción de imagen a imagen con redes adversas condicionales por Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. | Keras | Extraviado |
| Colorización de imagen colorida | B&W al color. | Keras | Extraviado |
| Ciclo | Implementación de la traducción de imagen a imagen no apareada utilizando redes adversas consistentes en ciclo . | Keras | Licencia de MIT |
| Dualgano | Implementación de Dualgan: aprendizaje dual no supervisado para la traducción de imagen a imagen . | Keras | Licencia de MIT |
| Gan de super-resolución | Implementación de una súper resolución fotográfica de una sola imagen realista utilizando una red adversaria generativa . | Keras | Licencia de MIT |
| Nombre del modelo | Descripción | Estructura | Licencia |
|---|---|---|---|
| detectrono2 | Detectron2 es el sistema de software de próxima generación de Facebook AI Research que implementa algoritmos de detección de objetos de última generación | PyTorch | Licencia de Apache 2.0 |
| Fastphotostyle | Una solución de forma cerrada para la estilización de imagen fotorrealista. | PyTorch | Creative Commons Attribution-No Comercial-Sharealike 4.0 Licencias públicas internacionales |
| pytorch-cyclegan-and-pix2pix | Una solución de forma cerrada para la estilización de imagen fotorrealista. | PyTorch | Licencia BSD |
| Maskrcnn-Benchmark | Implementación de referencia modular rápida de algoritmos de segmentación de instancias y detección de objetos en Pytorch. | PyTorch | Licencia de MIT |
| prior de imagen profunda | Restauración de imágenes con redes neuronales pero sin aprender. | PyTorch | Licencia de Apache 2.0 |
| Stargan | Stargan: redes adversas generativas unificadas para la traducción de imagen a imagen de dominio múltiple. | PyTorch | Licencia de MIT |
| más rápido-rcnn.pytorch | Este proyecto es una implementación R-CNN más rápida, con el objetivo de acelerar la capacitación de modelos de detección de objetos R-CNN más rápidos. | PyTorch | Licencia de MIT |
| pix2pixhd | Sintetizando y manipulando imágenes 2048x1024 con Gans condicionales. | PyTorch | Licencia BSD |
| Aumento | Biblioteca de aumento de imágenes en Python para el aprendizaje automático. | PyTorch | Licencia de MIT |
| albumentaciones | Biblioteca de aumento de imagen rápida. | PyTorch | Licencia de MIT |
| Análisis de video profundo | Deep Video Analytics es una plataforma para indexar y extraer información de videos e imágenes | PyTorch | Costumbre |
| segmentación semántica-pytorch | Implementación de Pytorch para segmentación semántica/análisis de escena en el conjunto de datos MIT ADE20K. | PyTorch | Licencia de BSD 3 cláusula |
| Una red neuronal capacitable de extremo a extremo para el reconocimiento de secuencias basado en imágenes | Este software implementa la red neuronal recurrente convolucional (CRNN), una combinación de pérdida de CNN, RNN y CTC para tareas de reconocimiento de secuencias basadas en imágenes, como el reconocimiento de texto de la escena y el OCR. | PyTorch | La licencia del MIT (MIT) |
| UNIDAD | Implementación de Pytorch de nuestro algoritmo VAE-Gan acoplado para la traducción de imagen a imagen no supervisada. | PyTorch | Creative Commons Attribution-No Comercial-Sharealike 4.0 Licencia pública internacional |
| Modelo de etiquetado de secuencia neural | Los modelos de etiquetado de secuencia son bastante populares en muchas tareas de PNL, como el reconocimiento de entidad nombrado (NER), el etiquetado de parte de voz (POS) y la segmentación de palabras. | PyTorch | Licencia de apache |
| rcnn más rápido | Esta es una implementación de Pytorch de RCNN más rápida. Este proyecto se basa principalmente en Py-Faster-RCNN y TFFRCNN. Para obtener detalles sobre R-CNN, consulte el documento R-CNN más rápido: hacia la detección de objetos en tiempo real con las redes de propuestas de región por Shaoqing Ren, Kaiming HE, Ross Girshick, Jian Sun. | PyTorch | Licencia de MIT |
| segmentación de pytorch-semántica | Pytorch para segmentación semántica. | PyTorch | Licencia de MIT |
| Edsr-pytorch | Versión de Pytorch del documento 'redes residuales profundas mejoradas para una súper resolución de imagen única'. | PyTorch | Licencia de MIT |
| móvil de clasificación de imagen | Colección de modelos de clasificación previamente en el ImageNet-1K. | PyTorch | Licencia de MIT |
| Fadernetworks | Fader Networks: Manipulando imágenes por atributos deslizantes - NIPS 2017. | PyTorch | Creative Commons Attribution-No Commercial 4.0 Licencia pública internacional |
| neuraltalk2-pytorch | Modelo de subtitulación de imágenes en Pytorch (Finetunable CNN en Branch With_finetune). | PyTorch | Licencia de MIT |
| Randwirenn | Implementación de: "Explorando redes neuronales con cable al azar para el reconocimiento de imágenes". | PyTorch | Extraviado |
| stackgan-v2 | La implementación de Pytorch para reproducir Stackgan_V2 da como resultado el papel Stackgan ++. | PyTorch | Licencia de MIT |
| Modelos de detectron para la detección de objetos | Este código permite usar algunos de los modelos de Detectron para la detección de objetos de Facebook AI Research con Pytorch. | PyTorch | Licencia de apache |
| Dextr-pytorch | Este documento explora el uso de puntos extremos en un objeto (píxeles de la izquierda, más derecha, arriba, inferior) como entrada para obtener una segmentación precisa de objetos para imágenes y videos. | PyTorch | Licencia pública general de GNU |
| Pointnet.pytorch | Implementación de Pytorch para "PointNet: aprendizaje profundo en conjuntos de puntos para clasificación y segmentación 3D. | PyTorch | Licencia de MIT |
| autocrítico.pytorch | Este repositorio incluye la implementación no oficial de capacitación en secuencia autocrítica para el subtítulos de imágenes y la atención de abajo hacia arriba y de arriba hacia abajo para el subtítulos de imágenes y la respuesta de preguntas visuales. | PyTorch | Licencia de MIT |
| vnet.pytorch | Una implementación de Pytorch para V-Net: redes neuronales totalmente convolucionales para la segmentación de imágenes médicas volumétricas. | PyTorch | Licencia de BSD 3 cláusula |
| piwise | Segmentación de píxel en el conjunto de datos VOC2012 usando Pytorch. | PyTorch | Licencia de BSD 3 cláusula |
| pspnet-pytorch | Implementación de Pytorch de la red de segmentación PSPNET. | PyTorch | Extraviado |
| Pytorch-Srresnet | Implementación de Pytorch para una súper resolución de imagen única fotográfica utilizando una red adversaria generativa. | PyTorch | La licencia del MIT (MIT) |
| Pnasnet.pytorch | Implementación de Pytorch de PNASNET-5 en Imagenet. | PyTorch | Licencia de apache |
| img_classification_pk_pytorch | Comparando rápidamente sus modelos de clasificación de imágenes con los modelos de última generación. | PyTorch | Extraviado |
| Las redes neuronales profundas se engañan fácilmente | Predicciones de alta confianza para imágenes irreconocibles. | PyTorch | Licencia de MIT |
| pix2pix-pytorch | Implementación de Pytorch de "traducción de imagen a imagen utilizando redes adversas condicionales". | PyTorch | Extraviado |
| Nvidia/segmentación semántica | Una implementación de Pytorch para mejorar la segmentación semántica a través de la propagación de video y la relajación de etiquetas, en CVPR2019. | PyTorch | Licencia CC BY-NC-SA 4.0 |
| Evaluación de la imagen neural | Una implementación de Pytorch de la evaluación de imágenes neuronales. | PyTorch | Extraviado |
| TorchxrayVision | Modelos previos a los modelos de rayos X de tórax (CXR) Predicciones de patología. Médico, salud, radiología | PyTorch | Licencia de apache |
| modelos de imagen de pytorch | Modelos de imagen de Pytorch, scripts, pesos previos a la aparición-(SE) Resnet/Resnext, DPN, EficeTientNet, MixNet, MobileNet-V3/V2, MNASNET, NAS de una sola vía, FBNET y más | PyTorch | Licencia de Apache 2.0 |
| Nombre del modelo | Descripción | Estructura | Licencia |
|---|---|---|---|
| Maniobra abierta | OpenPose representa el primer sistema multipersonal en tiempo real para detectar conjuntamente el cuerpo humano, los puntos clave de mano y faciales (en total 130 puntos clave) en imágenes individuales. | Caffe | Costumbre |
| Redes totalmente convolucionales para la segmentación semántica | Modelos totalmente convolucionales para la segmentación semántica. | Caffe | Extraviado |
| Colorización de imagen colorida | Colorido colorido de imagen. | Caffe | Licencia de cláusula BSD-2 |
| R-FCN | R-FCN: Detección de objetos a través de redes totalmente convolucionales basadas en la región. | Caffe | Licencia de MIT |
| cnn-vis | Inspirada en la reciente publicación del blog de Inceptionism de Google, CNN-VIS es una herramienta de código abierto que le permite usar redes neuronales convolucionales para generar imágenes. | Caffe | La licencia del MIT (MIT) |
| Deconvnet | Red de deconvolución de aprendizaje para la segmentación semántica. | Caffe | Costumbre |
| Nombre del modelo | Descripción | Estructura | Licencia |
|---|---|---|---|
| Rcnn más rápido | La red de propuestas de región resuelve la detección de objetos como un problema de regresión. | MXNet | Licencia Apache, versión 2.0 |
| SSD | SSD es un marco unificado para la detección de objetos con una sola red. | MXNet | Licencia de MIT |
| Pérdida focal RCNN+más rápida | El código es una versión no oficial para la pérdida focal para la detección densa de objetos. | MXNet | Extraviado |
| CNN-LSTM-CTC | Me doy cuenta de tres modelos diferentes para el reconocimiento de texto, y todos consisten en una capa de pérdida de CTC para realizar una segmentación para imágenes de texto. | MXNet | Extraviado |
| FASTER_RCNN_FOR_DOTA | Este es el repositorio oficial de Paper Dota: un conjunto de datos a gran escala para la detección de objetos en imágenes aéreas . | MXNet | Licencia de apache |
| Retinanet | Pérdida focal para la detección de objetos densos. | MXNet | Extraviado |
| Mobilenetv2 | Esta es una implementación de MXNET de la arquitectura MobileNetV2 como se describe en los residuos invertidos de papel y cuellos de botella lineales: redes móviles para clasificación, detección y segmentación . | MXNet | Licencia de apache |
| neurona-selectividad-transferencia | Este código es una reimplementación de los experimentos de clasificación de ImageNet en el documento como lo que le gusta: Knowledge Distill a través de la transferencia de selectividad de neuronas . | MXNet | Licencia de apache |
| Mobilenetv2 | Esta es una implementación de Gluon de la arquitectura MobileNetV2 como se describe en los residuos invertidos de papel y cuellos de botella lineales: redes móviles para clasificación, detección y segmentación . | MXNet | Licencia de apache |
| selección de estructura escasa | Este código es una reimplementación de los experimentos de clasificación de ImageNet en la selección de estructura dispersa basada en datos en papel para redes neuronales profundas . | MXNet | Licencia de apache |
| Fastphotostyle | Una solución de forma cerrada para la estilización de imagen fotorrealista. | MXNet | Creative Commons Attribution-No Comercial-Sharealike 4.0 Licencia pública internacional |
¡Tus contribuciones siempre son bienvenidas! Por favor, eche un vistazo a contributing.md
Licencia de MIT