Descarga CV pretrained model - Descargar el código fuente CV pretrained model

CV pretrained model

Pitón

Initial Release

Descargar

Modelos de visión por computadora provocada

Logotipo de CV

¿Qué es el modelo previamente capacitado?

Un modelo previamente capacitado es un modelo creado por alguien más para resolver un problema similar. En lugar de construir un modelo desde cero para resolver un problema similar, podemos usar el modelo entrenado en otro problema como punto de partida. Un modelo previamente capacitado puede no ser 100% preciso en su aplicación.

Por ejemplo, si desea construir un auto de aprendizaje automático. Puede pasar años para construir un algoritmo de reconocimiento de imagen decente desde cero o puede tomar el modelo de inicio (un modelo previamente capacitado) de Google que se basó en datos de Imagenet para identificar imágenes en esas imágenes.

Otros modelos previamente capacitados

Modelos previamente capacitados de PNL.
Modelos previamente capacitados de audio y discurso

Biblioteca de implementación de modelos

Modelo

Estructura

Flujo tensor
Keras
Pytorch
Cafetería
Mxnet

Visualización del modelo

Puede ver visualizaciones de la arquitectura de red de cada modelo utilizando Netron.

Logotipo de CV

Flujo tensor

Nombre del modelo	Descripción	Estructura	Licencia
Detección de objetos	Localización e identificación de múltiples objetos en una sola imagen.	`Tensorflow`	Licencia de apache
Máscara R-CNN	El modelo genera cuadros delimitadores y máscaras de segmentación para cada instancia de un objeto en la imagen. Se basa en Feature Pyramid Network (FPN) y una columna vertebral resnet101.	`Tensorflow`	La licencia del MIT (MIT)
Rcnn más rápido	Esta es una implementación experimental de flujo de tensor de RCNN más rápido: un convet de convetidos para la detección de objetos con una red de propuestas de región.	`Tensorflow`	Licencia de MIT
Yolo tensorflow	Esta es la implementación de TensorFlow de Yolo: detección de objetos en tiempo real.	`Tensorflow`	Costumbre
Yolo tensorflow ++	Implementación de TensorFlow de 'Yolo: detección de objetos en tiempo real', con capacitación y un soporte real para la ejecución en tiempo real en dispositivos móviles.	`Tensorflow`	Licencia pública general de GNU
Mobilenet	MobileNets intercambia entre latencia, tamaño y precisión mientras se comparan favorablemente con los modelos populares de la literatura.	`Tensorflow`	La licencia del MIT (MIT)
Piloto profundo	Etiquetado profundo para la segmentación de imágenes semánticas.	`Tensorflow`	Licencia de apache
Colornet	Red neuronal para colorear imágenes en escala de grises.	`Tensorflow`	Extraviado
Srgan	SUPER-RESOLUCIÓN Photo-Realista SUPERACIÓN UTILIZANDO una red adversaria generativa.	`Tensorflow`	Extraviado
Profundo	Train TensorFlow Nets Neural con características de OpenStreetMap y imágenes satelitales.	`Tensorflow`	La licencia del MIT (MIT)
Red de transferencia de dominio	Implementación de la generación de imágenes de dominio cruzado no supervisado.	`Tensorflow`	Licencia de MIT
Mostrar, asistir y contar	Generador de subtítulos de imagen basado en la atención.	`Tensorflow`	Licencia de MIT
Android-yolo	Detección de objetos en tiempo real en Android usando la red Yolo, alimentada por TensorFlow.	`Tensorflow`	Licencia de apache
DCSCN Super Resolución	Esta es una implementación de TensorFlow de "Super resolución de imagen rápida y precisa por CNN profunda con conexión de omisión y red en la red", un modelo de super-resolución (SISR) basado en el aprendizaje profundo (SISR).	`Tensorflow`	Extraviado
Gan-cls	Esta es una implementación experimental de flujo de tensor de imágenes de sintetización.	`Tensorflow`	Extraviado
Net	Para la segmentación del tumor cerebral.	`Tensorflow`	Extraviado
Cyclegan mejorado	Imagen no apareada a la traducción de la imagen.	`Tensorflow`	Licencia de MIT
Im2txt	Red neural de imagen a texto para subtítulos de imágenes.	`Tensorflow`	Licencia de apache
DELGADO	Modelos de clasificación de imágenes en TF-Slim.	`Tensorflow`	Licencia de apache
Matón	Características locales profundas para la coincidencia y recuperación de imágenes.	`Tensorflow`	Licencia de apache
Compresión	Comprimir y descomprimir imágenes utilizando una red GRU residual previamente entrenada.	`Tensorflow`	Licencia de apache
Atención	Un modelo para extracción de texto de imagen del mundo real.	`Tensorflow`	Licencia de apache

↥ De vuelta a la cima

Keras

Nombre del modelo	Descripción	Estructura	Licencia
Máscara R-CNN	El modelo genera cuadros delimitadores y máscaras de segmentación para cada instancia de un objeto en la imagen. Se basa en Feature Pyramid Network (FPN) y una columna vertebral resnet101.	`Keras`	La licencia del MIT (MIT)
VGG16	Redes convolucionales muy profundas para el reconocimiento de imágenes a gran escala.	`Keras`	La licencia del MIT (MIT)
VGG19	Redes convolucionales muy profundas para el reconocimiento de imágenes a gran escala.	`Keras`	La licencia del MIT (MIT)
Resnet	Aprendizaje residual profundo para el reconocimiento de imágenes.	`Keras`	La licencia del MIT (MIT)
Resnet50	Aprendizaje residual profundo para el reconocimiento de imágenes.	`Keras`	La licencia del MIT (MIT)
Nasnet	Nasnet se refiere a la red de búsqueda de arquitectura neural, una familia de modelos que se diseñaron automáticamente al aprender las arquitecturas de modelos directamente en el conjunto de datos de interés.	`Keras`	La licencia del MIT (MIT)
Mobilenet	Modelos Mobilenet V1 para Keras.	`Keras`	La licencia del MIT (MIT)
Mobilenet V2	Modelos Mobilenet V2 para Keras.	`Keras`	La licencia del MIT (MIT)
Mobilenet V3	Modelos MobileNet V3 para Keras.	`Keras`	La licencia del MIT (MIT)
EficeTnet	Repensar la escala del modelo para redes neuronales convolucionales.	`Keras`	La licencia del MIT (MIT)
Analogías de imagen	Genere analogías de imagen utilizando la coincidencia neural y la mezcla.	`Keras`	La licencia del MIT (MIT)
Modelos populares de segmentación de imágenes	Implementación de Segnet, FCN, UNET y otros modelos en Keras.	`Keras`	Licencia de MIT
Segmentación nerviosa de ultrasonido	Este tutorial muestra cómo usar la biblioteca Keras para construir una red neuronal profunda para la segmentación del nervio de la imagen de ultrasonido.	`Keras`	Licencia de MIT
Segmentación de objetos de la máscara profunda	Esta es una implementación de Python basada en Keras de Deepmask, una red neuronal profunda compleja para aprender máscaras de segmentación de objetos.	`Keras`	Extraviado
Subtítulos de imágenes monolingües y multilingües	Este es el código fuente que acompaña a la descripción de la imagen multilingüe con modelos de secuencia neural.	`Keras`	Licencia de cláusula BSD-3
pix2pix	Implementación de Keras de traducción de imagen a imagen con redes adversas condicionales por Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A.	`Keras`	Extraviado
Colorización de imagen colorida	B&W al color.	`Keras`	Extraviado
Ciclo	Implementación de la traducción de imagen a imagen no apareada utilizando redes adversas consistentes en ciclo .	`Keras`	Licencia de MIT
Dualgano	Implementación de Dualgan: aprendizaje dual no supervisado para la traducción de imagen a imagen .	`Keras`	Licencia de MIT
Gan de super-resolución	Implementación de una súper resolución fotográfica de una sola imagen realista utilizando una red adversaria generativa .	`Keras`	Licencia de MIT

↥ De vuelta a la cima

Pytorch

Nombre del modelo	Descripción	Estructura	Licencia
detectrono2	Detectron2 es el sistema de software de próxima generación de Facebook AI Research que implementa algoritmos de detección de objetos de última generación	`PyTorch`	Licencia de Apache 2.0
Fastphotostyle	Una solución de forma cerrada para la estilización de imagen fotorrealista.	`PyTorch`	Creative Commons Attribution-No Comercial-Sharealike 4.0 Licencias públicas internacionales
pytorch-cyclegan-and-pix2pix	Una solución de forma cerrada para la estilización de imagen fotorrealista.	`PyTorch`	Licencia BSD
Maskrcnn-Benchmark	Implementación de referencia modular rápida de algoritmos de segmentación de instancias y detección de objetos en Pytorch.	`PyTorch`	Licencia de MIT
prior de imagen profunda	Restauración de imágenes con redes neuronales pero sin aprender.	`PyTorch`	Licencia de Apache 2.0
Stargan	Stargan: redes adversas generativas unificadas para la traducción de imagen a imagen de dominio múltiple.	`PyTorch`	Licencia de MIT
más rápido-rcnn.pytorch	Este proyecto es una implementación R-CNN más rápida, con el objetivo de acelerar la capacitación de modelos de detección de objetos R-CNN más rápidos.	`PyTorch`	Licencia de MIT
pix2pixhd	Sintetizando y manipulando imágenes 2048x1024 con Gans condicionales.	`PyTorch`	Licencia BSD
Aumento	Biblioteca de aumento de imágenes en Python para el aprendizaje automático.	`PyTorch`	Licencia de MIT
albumentaciones	Biblioteca de aumento de imagen rápida.	`PyTorch`	Licencia de MIT
Análisis de video profundo	Deep Video Analytics es una plataforma para indexar y extraer información de videos e imágenes	`PyTorch`	Costumbre
segmentación semántica-pytorch	Implementación de Pytorch para segmentación semántica/análisis de escena en el conjunto de datos MIT ADE20K.	`PyTorch`	Licencia de BSD 3 cláusula
Una red neuronal capacitable de extremo a extremo para el reconocimiento de secuencias basado en imágenes	Este software implementa la red neuronal recurrente convolucional (CRNN), una combinación de pérdida de CNN, RNN y CTC para tareas de reconocimiento de secuencias basadas en imágenes, como el reconocimiento de texto de la escena y el OCR.	`PyTorch`	La licencia del MIT (MIT)
UNIDAD	Implementación de Pytorch de nuestro algoritmo VAE-Gan acoplado para la traducción de imagen a imagen no supervisada.	`PyTorch`	Creative Commons Attribution-No Comercial-Sharealike 4.0 Licencia pública internacional
Modelo de etiquetado de secuencia neural	Los modelos de etiquetado de secuencia son bastante populares en muchas tareas de PNL, como el reconocimiento de entidad nombrado (NER), el etiquetado de parte de voz (POS) y la segmentación de palabras.	`PyTorch`	Licencia de apache
rcnn más rápido	Esta es una implementación de Pytorch de RCNN más rápida. Este proyecto se basa principalmente en Py-Faster-RCNN y TFFRCNN. Para obtener detalles sobre R-CNN, consulte el documento R-CNN más rápido: hacia la detección de objetos en tiempo real con las redes de propuestas de región por Shaoqing Ren, Kaiming HE, Ross Girshick, Jian Sun.	`PyTorch`	Licencia de MIT
segmentación de pytorch-semántica	Pytorch para segmentación semántica.	`PyTorch`	Licencia de MIT
Edsr-pytorch	Versión de Pytorch del documento 'redes residuales profundas mejoradas para una súper resolución de imagen única'.	`PyTorch`	Licencia de MIT
móvil de clasificación de imagen	Colección de modelos de clasificación previamente en el ImageNet-1K.	`PyTorch`	Licencia de MIT
Fadernetworks	Fader Networks: Manipulando imágenes por atributos deslizantes - NIPS 2017.	`PyTorch`	Creative Commons Attribution-No Commercial 4.0 Licencia pública internacional
neuraltalk2-pytorch	Modelo de subtitulación de imágenes en Pytorch (Finetunable CNN en Branch With_finetune).	`PyTorch`	Licencia de MIT
Randwirenn	Implementación de: "Explorando redes neuronales con cable al azar para el reconocimiento de imágenes".	`PyTorch`	Extraviado
stackgan-v2	La implementación de Pytorch para reproducir Stackgan_V2 da como resultado el papel Stackgan ++.	`PyTorch`	Licencia de MIT
Modelos de detectron para la detección de objetos	Este código permite usar algunos de los modelos de Detectron para la detección de objetos de Facebook AI Research con Pytorch.	`PyTorch`	Licencia de apache
Dextr-pytorch	Este documento explora el uso de puntos extremos en un objeto (píxeles de la izquierda, más derecha, arriba, inferior) como entrada para obtener una segmentación precisa de objetos para imágenes y videos.	`PyTorch`	Licencia pública general de GNU
Pointnet.pytorch	Implementación de Pytorch para "PointNet: aprendizaje profundo en conjuntos de puntos para clasificación y segmentación 3D.	`PyTorch`	Licencia de MIT
autocrítico.pytorch	Este repositorio incluye la implementación no oficial de capacitación en secuencia autocrítica para el subtítulos de imágenes y la atención de abajo hacia arriba y de arriba hacia abajo para el subtítulos de imágenes y la respuesta de preguntas visuales.	`PyTorch`	Licencia de MIT
vnet.pytorch	Una implementación de Pytorch para V-Net: redes neuronales totalmente convolucionales para la segmentación de imágenes médicas volumétricas.	`PyTorch`	Licencia de BSD 3 cláusula
piwise	Segmentación de píxel en el conjunto de datos VOC2012 usando Pytorch.	`PyTorch`	Licencia de BSD 3 cláusula
pspnet-pytorch	Implementación de Pytorch de la red de segmentación PSPNET.	`PyTorch`	Extraviado
Pytorch-Srresnet	Implementación de Pytorch para una súper resolución de imagen única fotográfica utilizando una red adversaria generativa.	`PyTorch`	La licencia del MIT (MIT)
Pnasnet.pytorch	Implementación de Pytorch de PNASNET-5 en Imagenet.	`PyTorch`	Licencia de apache
img_classification_pk_pytorch	Comparando rápidamente sus modelos de clasificación de imágenes con los modelos de última generación.	`PyTorch`	Extraviado
Las redes neuronales profundas se engañan fácilmente	Predicciones de alta confianza para imágenes irreconocibles.	`PyTorch`	Licencia de MIT
pix2pix-pytorch	Implementación de Pytorch de "traducción de imagen a imagen utilizando redes adversas condicionales".	`PyTorch`	Extraviado
Nvidia/segmentación semántica	Una implementación de Pytorch para mejorar la segmentación semántica a través de la propagación de video y la relajación de etiquetas, en CVPR2019.	`PyTorch`	Licencia CC BY-NC-SA 4.0
Evaluación de la imagen neural	Una implementación de Pytorch de la evaluación de imágenes neuronales.	`PyTorch`	Extraviado
TorchxrayVision	Modelos previos a los modelos de rayos X de tórax (CXR) Predicciones de patología. Médico, salud, radiología	`PyTorch`	Licencia de apache
modelos de imagen de pytorch	Modelos de imagen de Pytorch, scripts, pesos previos a la aparición-(SE) Resnet/Resnext, DPN, EficeTientNet, MixNet, MobileNet-V3/V2, MNASNET, NAS de una sola vía, FBNET y más	`PyTorch`	Licencia de Apache 2.0

↥ De vuelta a la cima

Cafetería

Nombre del modelo	Descripción	Estructura	Licencia
Maniobra abierta	OpenPose representa el primer sistema multipersonal en tiempo real para detectar conjuntamente el cuerpo humano, los puntos clave de mano y faciales (en total 130 puntos clave) en imágenes individuales.	`Caffe`	Costumbre
Redes totalmente convolucionales para la segmentación semántica	Modelos totalmente convolucionales para la segmentación semántica.	`Caffe`	Extraviado
Colorización de imagen colorida	Colorido colorido de imagen.	`Caffe`	Licencia de cláusula BSD-2
R-FCN	R-FCN: Detección de objetos a través de redes totalmente convolucionales basadas en la región.	`Caffe`	Licencia de MIT
cnn-vis	Inspirada en la reciente publicación del blog de Inceptionism de Google, CNN-VIS es una herramienta de código abierto que le permite usar redes neuronales convolucionales para generar imágenes.	`Caffe`	La licencia del MIT (MIT)
Deconvnet	Red de deconvolución de aprendizaje para la segmentación semántica.	`Caffe`	Costumbre

↥ De vuelta a la cima

Mxnet

Nombre del modelo	Descripción	Estructura	Licencia
Rcnn más rápido	La red de propuestas de región resuelve la detección de objetos como un problema de regresión.	`MXNet`	Licencia Apache, versión 2.0
SSD	SSD es un marco unificado para la detección de objetos con una sola red.	`MXNet`	Licencia de MIT
Pérdida focal RCNN+más rápida	El código es una versión no oficial para la pérdida focal para la detección densa de objetos.	`MXNet`	Extraviado
CNN-LSTM-CTC	Me doy cuenta de tres modelos diferentes para el reconocimiento de texto, y todos consisten en una capa de pérdida de CTC para realizar una segmentación para imágenes de texto.	`MXNet`	Extraviado
FASTER_RCNN_FOR_DOTA	Este es el repositorio oficial de Paper Dota: un conjunto de datos a gran escala para la detección de objetos en imágenes aéreas .	`MXNet`	Licencia de apache
Retinanet	Pérdida focal para la detección de objetos densos.	`MXNet`	Extraviado
Mobilenetv2	Esta es una implementación de MXNET de la arquitectura MobileNetV2 como se describe en los residuos invertidos de papel y cuellos de botella lineales: redes móviles para clasificación, detección y segmentación .	`MXNet`	Licencia de apache
neurona-selectividad-transferencia	Este código es una reimplementación de los experimentos de clasificación de ImageNet en el documento como lo que le gusta: Knowledge Distill a través de la transferencia de selectividad de neuronas .	`MXNet`	Licencia de apache
Mobilenetv2	Esta es una implementación de Gluon de la arquitectura MobileNetV2 como se describe en los residuos invertidos de papel y cuellos de botella lineales: redes móviles para clasificación, detección y segmentación .	`MXNet`	Licencia de apache
selección de estructura escasa	Este código es una reimplementación de los experimentos de clasificación de ImageNet en la selección de estructura dispersa basada en datos en papel para redes neuronales profundas .	`MXNet`	Licencia de apache
Fastphotostyle	Una solución de forma cerrada para la estilización de imagen fotorrealista.	`MXNet`	Creative Commons Attribution-No Comercial-Sharealike 4.0 Licencia pública internacional