
Um modelo pré-treinado é um modelo criado por alguém para resolver um problema semelhante. Em vez de criar um modelo do zero para resolver um problema semelhante, podemos usar o modelo treinado em outro problema como ponto de partida. Um modelo pré-treinado pode não ser 100% preciso em seu aplicativo.
Por exemplo, se você deseja construir um carro auto -aprendizado. Você pode passar anos para criar um algoritmo decente de reconhecimento de imagem a partir do zero ou pode tomar o modelo de início (um modelo pré-treinado) do Google, que foi construído nos dados do ImageNet para identificar imagens nessas imagens.
Você pode ver visualizações da arquitetura de rede de cada modelo usando o Netron.

| Nome do modelo | Descrição | Estrutura | Licença |
|---|---|---|---|
| ObjectDetection | Localizando e identificando vários objetos em uma única imagem. | Tensorflow | Licença Apache |
| Máscara R-CNN | O modelo gera caixas delimitadoras e máscaras de segmentação para cada instância de um objeto na imagem. É baseado na rede de pirâmide de recursos (FPN) e em um backbone RESNET101. | Tensorflow | A licença do MIT (MIT) |
| Mais rápido-rcnn | Esta é uma implementação experimental de tensorflow de RCNN mais rápido - um convnet para detecção de objetos com uma rede de propostas de região. | Tensorflow | MIT Licença |
| YOLO Tensorflow | Esta é a implementação do tensorflow do YOLO: Detecção de objetos em tempo real. | Tensorflow | Personalizado |
| YOLO Tensorflow ++ | Implementação do TensorFlow de 'Yolo: Detecção de Objetos em tempo real', com treinamento e suporte real para a execução em tempo real em dispositivos móveis. | Tensorflow | GNU Licença pública geral |
| MobileNet | Os mobilenets trocam entre latência, tamanho e precisão enquanto comparam favoravelmente com modelos populares da literatura. | Tensorflow | A licença do MIT (MIT) |
| Deeplab | Rotulagem profunda para segmentação de imagem semântica. | Tensorflow | Licença Apache |
| Colornet | Rede neural para colorizar imagens em escala de cinza. | Tensorflow | Não encontrado |
| Srgan | Super-resolução de imagem única foto-realista usando uma rede adversária generativa. | Tensorflow | Não encontrado |
| Deeposm | Treine redes neurais do Tensorflow com recursos do OpenStreetMap e imagens de satélite. | Tensorflow | A licença do MIT (MIT) |
| Rede de transferência de domínio | Implementação de geração de imagens de domínio cruzado não supervisionado. | Tensorflow | MIT Licença |
| Mostrar, comparecer e contar | Gerador de legenda de imagem baseada na atenção. | Tensorflow | MIT Licença |
| Android-Yolo | Detecção de objetos em tempo real no Android usando a rede YOLO, alimentada pelo TensorFlow. | Tensorflow | Licença Apache |
| Super resolução do DCSCN | Esta é uma implementação do TensorFlow de "Super resolução de imagem rápida e precisa da CNN profunda com conexão e rede de SKIP na rede", um modelo de super-resolução de imagem única baseada em aprendizado profundo (SISR). | Tensorflow | Não encontrado |
| Gan-CLS | Esta é uma implementação experimental do TensorFlow de sintetizar imagens. | Tensorflow | Não encontrado |
| U-net | Para segmentação do tumor cerebral. | Tensorflow | Não encontrado |
| Cyclegan aprimorado | Imagem não pareada para tradução da imagem. | Tensorflow | MIT Licença |
| Im2txt | Rede neural de imagem para texto para legenda de imagem. | Tensorflow | Licença Apache |
| MAGRO | Modelos de classificação de imagem em TF-Slim. | Tensorflow | Licença Apache |
| Delf | Recursos locais profundos para correspondência e recuperação de imagens. | Tensorflow | Licença Apache |
| Compressão | Compresso e descompactando imagens usando uma rede residual pré-treinada GRU. | Tensorflow | Licença Apache |
| Atresterocr | Um modelo para extração de texto da imagem do mundo real. | Tensorflow | Licença Apache |
| Nome do modelo | Descrição | Estrutura | Licença |
|---|---|---|---|
| Máscara R-CNN | O modelo gera caixas delimitadoras e máscaras de segmentação para cada instância de um objeto na imagem. É baseado na rede de pirâmide de recursos (FPN) e em um backbone RESNET101. | Keras | A licença do MIT (MIT) |
| VGG16 | Redes convolucionais muito profundas para reconhecimento de imagem em larga escala. | Keras | A licença do MIT (MIT) |
| VGG19 | Redes convolucionais muito profundas para reconhecimento de imagem em larga escala. | Keras | A licença do MIT (MIT) |
| Resnet | Aprendizado residual profundo para reconhecimento de imagem. | Keras | A licença do MIT (MIT) |
| Resnet50 | Aprendizado residual profundo para reconhecimento de imagem. | Keras | A licença do MIT (MIT) |
| Nasnet | A NASNET refere -se à rede de pesquisa de arquitetura neural, uma família de modelos que foram projetados automaticamente aprendendo as arquiteturas do modelo diretamente no conjunto de dados de interesse. | Keras | A licença do MIT (MIT) |
| MobileNet | Modelos MobileNet V1 para Keras. | Keras | A licença do MIT (MIT) |
| MobileNet V2 | Modelos MobileNet V2 para Keras. | Keras | A licença do MIT (MIT) |
| MobileNet V3 | Modelos MobileNet V3 para Keras. | Keras | A licença do MIT (MIT) |
| eficienteNET | Repensando o escala do modelo para redes neurais convolucionais. | Keras | A licença do MIT (MIT) |
| Analogias de imagem | Gere analogias de imagem usando correspondência e mistura neural. | Keras | A licença do MIT (MIT) |
| Modelos de segmentação de imagem populares | Implementação de modelos Segnet, FCN, UNET e outros em Keras. | Keras | MIT Licença |
| Segmentação do nervo por ultrassom | Este tutorial mostra como usar a biblioteca Keras para criar uma rede neural profunda para segmentação do nervo de imagem por ultrassom. | Keras | MIT Licença |
| Segmentação de objetos de máscara profunda | Esta é uma implementação Python baseada em Keras de máscara de DeepMask- uma complexa rede neural profunda para aprender máscaras de segmentação de objetos. | Keras | Não encontrado |
| Legenda de imagem monolíngue e multilíngue | Este é o código -fonte que acompanha a descrição da imagem multilíngue com os modelos de sequência neural. | Keras | Licença de cláusula BSD-3 |
| pix2pix | Implementação de Keras da tradução de imagem para imagem com redes adversárias condicionais de Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. | Keras | Não encontrado |
| Colorização colorida da imagem | B&W para colorir. | Keras | Não encontrado |
| Cyclegan | Implementação de tradução de imagem para imagem não emparelhada usando redes adversárias consistentes com ciclo consistente . | Keras | MIT Licença |
| Dualgan | Implementação do Dualgan: Aprendizagem dupla não supervisionada para tradução de imagem para imagem . | Keras | MIT Licença |
| Super-resolução Gan | Implementação de super resolução foto-realista de imagem única usando uma rede adversária generativa . | Keras | MIT Licença |
| Nome do modelo | Descrição | Estrutura | Licença |
|---|---|---|---|
| Detectron2 | Detectron2 é o sistema de software da próxima geração da pesquisa do Facebook que implementa algoritmos de detecção de objetos de última geração | PyTorch | Licença Apache 2.0 |
| Fastphotostyle | Uma solução de forma fechada para a estilização de imagem fotorrealista. | PyTorch | Creative Commons Attribution-NonCommercial-Sharealike 4.0 International Public Licens |
| pytorch-cyclegan e pix2pix | Uma solução de forma fechada para a estilização de imagem fotorrealista. | PyTorch | Licença BSD |
| Markrcnn-benchmark | Implementação de referência modular rápida da segmentação de instância e algoritmos de detecção de objetos em Pytorch. | PyTorch | MIT Licença |
| prior de imagem profunda | Restauração de imagens com redes neurais, mas sem aprender. | PyTorch | Licença Apache 2.0 |
| Stargan | Stargan: Redes adversárias generativas unificadas para tradução para imagens para imagens de vários domínios. | PyTorch | MIT Licença |
| mais rápido rcnn.pytorch | Este projeto é uma implementação R-CNN mais rápida, com o objetivo de acelerar o treinamento de modelos de detecção de objetos R-CNN mais rápidos. | PyTorch | MIT Licença |
| pix2pixhd | Sintetizando e manipulando imagens 2048x1024 com gans condicional. | PyTorch | Licença BSD |
| AUMPENTADOR | Biblioteca de aumento de imagem em Python para aprendizado de máquina. | PyTorch | MIT Licença |
| albumumentações | Biblioteca de Aumentação de Imagem Fast. | PyTorch | MIT Licença |
| Análise de vídeo profunda | Deep Video Analytics é uma plataforma para indexar e extrair informações de vídeos e imagens | PyTorch | Personalizado |
| Segmentação semântica-Pytorch | Implementação de Pytorch para segmentação semântica/cena analisando o conjunto de dados do MIT Ade20K. | PyTorch | Licença de 3 cláusulas BSD |
| Uma rede neural treinável de ponta a ponta para reconhecimento de sequência baseado em imagem | Este software implementa a Rede Neural Convolucional Recorrente (CRNN), uma combinação de perda de CNN, RNN e CTC para tarefas de reconhecimento de sequência baseadas em imagem, como reconhecimento de texto da cena e OCR. | PyTorch | A licença do MIT (MIT) |
| UNIDADE | A implementação do Pytorch do nosso algoritmo VAE-GAN acoplado para tradução de imagem para imagem não supervisionada. | PyTorch | Creative Commons Attribution-NonCommercial-Sharealike 4.0 Licença Pública Internacional |
| Modelo de rotulagem de sequência neural | Os modelos de rotulagem de sequência são bastante populares em muitas tarefas de PNL, como reconhecimento de entidade nomeado (NER), marcação de parte da fala (POS) e segmentação de palavras. | PyTorch | Licença Apache |
| RCNN mais rápido | Esta é uma implementação Pytorch de RCNN mais rápido. Este projeto é baseado principalmente em py-gast-rcnn e tffrcnn. Para detalhes sobre o R-CNN, consulte o artigo mais rápido R-CNN: Rumo a detecção de objetos em tempo real com redes de propostas de região de Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun. | PyTorch | MIT Licença |
| Pytorch-semantica-segmentação | Pytorch para segmentação semântica. | PyTorch | MIT Licença |
| Edsr-Pytorch | Versão Pytorch das redes residuais profundas aprimoradas para super-resolução de imagem única '. | PyTorch | MIT Licença |
| Classificação de imagem-Mobile | Coleção de modelos de classificação pré-criada no ImageNet-1K. | PyTorch | MIT Licença |
| Fadernetworks | Redes Fader: manipulando imagens por atributos deslizantes - NIPS 2017. | PyTorch | Creative Commons Attribution-NonCommercial 4.0 International Public License |
| NeuralTalk2-Pytorch | Modelo de legenda de imagem em Pytorch (CNN FinetUnable em ramificação com_finetune). | PyTorch | MIT Licença |
| Randwirenn | Implementação de: "Explorando redes neurais com fio aleatoriamente para reconhecimento de imagem". | PyTorch | Não encontrado |
| Stackgan-V2 | A implementação do Pytorch para reproduzir o Stackgan_v2 resulta no papel Stackgan ++. | PyTorch | MIT Licença |
| Modelos Detectron para Detecção de Objetos | Este código permite usar alguns dos modelos Detectron para detecção de objetos da pesquisa da IA do Facebook com a Pytorch. | PyTorch | Licença Apache |
| Dextr-Pytorch | Este artigo explora o uso de pontos extremos em um objeto (pixels mais altos, mais à direita, superior e inferior) como entrada para obter segmentação precisa de objetos para imagens e vídeos. | PyTorch | GNU Licença pública geral |
| PointNet.Pytorch | Implementação de Pytorch para "PointNet: aprendizado profundo nos conjuntos de pontos para classificação e segmentação 3D. | PyTorch | MIT Licença |
| autocrítico.pytorch | Este repositório inclui o treinamento de sequência autocrítica de implementação não oficial para a legenda da imagem e a atenção de baixo para cima e de cima para baixo para a legenda da imagem e a resposta das perguntas visuais. | PyTorch | MIT Licença |
| vnet.pytorch | Uma implementação de Pytorch para V-Net: redes neurais totalmente convolucionais para segmentação volumétrica de imagem médica. | PyTorch | Licença de 3 cláusulas BSD |
| PiWise | Segmentação de pixels no conjunto de dados VOC2012 usando Pytorch. | PyTorch | Licença de 3 cláusulas BSD |
| Pspnet-Pytorch | Implementação de Pytorch da rede de segmentação do PSPNET. | PyTorch | Não encontrado |
| pytorch-srresnet | Implementação de Pytorch para super resolução de imagem única foto-realista usando uma rede adversária generativa. | PyTorch | A licença do MIT (MIT) |
| Pnasnet.pytorch | Implementação de Pytorch do PNASNET-5 no ImageNet. | PyTorch | Licença Apache |
| img_classification_pk_pytorch | Comparando rapidamente seus modelos de classificação de imagem com os modelos de última geração. | PyTorch | Não encontrado |
| Redes neurais profundas são facilmente enganadas | Previsões de alta confiança para imagens irreconhecíveis. | PyTorch | MIT Licença |
| pix2pix-pytorch | Implementação de Pytorch de "Tradução de imagem para imagem usando redes adversárias condicionais". | PyTorch | Não encontrado |
| Nvidia/semântica-segmentação | Uma implementação de Pytorch da melhoria da segmentação semântica por meio de propagação de vídeo e relaxamento de etiquetas, no CVPR2019. | PyTorch | Licença CC BY-NC-SA 4.0 |
| Avaliação neural de imagem | Uma implementação de Pytorch da avaliação da imagem neural. | PyTorch | Não encontrado |
| TorchxrayVision | Modelos pré-criados para previsões de patologia de radiografia de tórax (CXR). Médico, saúde, radiologia | PyTorch | Licença Apache |
| Modelos Pytorch-Image | Modelos de imagem pytorch, scripts, pesos pré-tenhados-(se) resnet/ressext, dpn, eficientNet, mixnet, mobileNet-v3/v2, mnasNet, NAS, fbnet e mais | PyTorch | Licença Apache 2.0 |
| Nome do modelo | Descrição | Estrutura | Licença |
|---|---|---|---|
| Uso de unha aberta | O Open representa o primeiro sistema em várias pessoas em tempo real para detectar em conjunto o corpo, as mãos e os pontos de chave faciais (no total de 130 pontos-chave) em imagens únicas. | Caffe | Personalizado |
| Redes totalmente convolucionais para segmentação semântica | Modelos totalmente convolucionais para segmentação semântica. | Caffe | Não encontrado |
| Colorização colorida da imagem | Colorização colorida da imagem. | Caffe | Licença de BSD-2-cláusula |
| R-FCN | R-FCN: Detecção de objetos por meio de redes totalmente convolucionais baseadas na região. | Caffe | MIT Licença |
| CNN-vis | Inspirado na recente postagem do blog do Google, o CNN-vis é uma ferramenta de código aberto que permite usar redes neurais convolucionais para gerar imagens. | Caffe | A licença do MIT (MIT) |
| Deconvnet | Rede de Deconvolução de Aprendizagem para Segmentação Semântica. | Caffe | Personalizado |
| Nome do modelo | Descrição | Estrutura | Licença |
|---|---|---|---|
| RCNN mais rápido | A rede de propostas de região resolve a detecção de objetos como um problema de regressão. | MXNet | Licença Apache, versão 2.0 |
| SSD | O SSD é uma estrutura unificada para detecção de objetos com uma única rede. | MXNet | MIT Licença |
| RCNN mais rápida+perda focal | O código é uma versão não oficial para perda focal para detecção de densa de objetos. | MXNet | Não encontrado |
| CNN-LSTM-CTC | Percebo que três modelos diferentes para reconhecimento de texto e todos eles consistem na camada de perda de CTC para não realizar segmentação para imagens de texto. | MXNet | Não encontrado |
| FASTER_RCNN_FOR_DOTA | Este é o repositório oficial do Paper Dota: um conjunto de dados em larga escala para detecção de objetos em imagens aéreas . | MXNet | Licença Apache |
| Retinnet | Perda focal para detecção densa de objetos. | MXNet | Não encontrado |
| MobileNetv2 | Esta é uma implementação MXNET da arquitetura MobileNetv2, conforme descrito nos resíduos invertidos de papel e gargalos lineares: redes móveis para classificação, detecção e segmentação . | MXNet | Licença Apache |
| transferência de neurônios-selectividade | Este código é uma reimplementação dos experimentos de classificação do ImageNet no artigo como o que você gosta: o conhecimento da transferência de seletividade de neurônios . | MXNet | Licença Apache |
| MobileNetv2 | Esta é uma implementação de gluon da arquitetura MobileNetv2, conforme descrito nos resíduos invertidos de papel e gargalos lineares: redes móveis para classificação, detecção e segmentação . | MXNet | Licença Apache |
| seleção de estrutura esparsa | Este código é uma reimplementação dos experimentos de classificação do ImageNet na seleção de estrutura esparsa orientada por dados para redes neurais profundas . | MXNet | Licença Apache |
| Fastphotostyle | Uma solução de forma fechada para a estilização de imagem fotorrealista. | MXNet | Creative Commons Attribution-NonCommercial-Sharealike 4.0 Licença Pública Internacional |
Suas contribuições são sempre bem -vindas !! Por favor, dê uma olhada em contributing.md
MIT Licença