CV pretrained model
Initial Release

미리 훈련 된 모델은 유사한 문제를 해결하기 위해 다른 사람이 만든 모델입니다. 비슷한 문제를 해결하기 위해 모델을 처음부터 구축하는 대신 다른 문제에 대해 훈련 된 모델을 출발점으로 사용할 수 있습니다. 사전 훈련 된 모델은 애플리케이션에서 100% 정확하지 않을 수 있습니다.
예를 들어, 셀프 학습 차량을 만들고 싶다면. 처음부터 괜찮은 이미지 인식 알고리즘을 구축하는 데 수년을 소비하거나 Google에서 Imagenet 데이터를 구축하여 해당 사진의 이미지를 식별 한 Google에서 시작 모델 (사전 훈련 된 모델)을 가져올 수 있습니다.
Netron을 사용하여 각 모델의 네트워크 아키텍처의 시각화를 볼 수 있습니다.

| 모델 이름 | 설명 | 뼈대 | 특허 |
|---|---|---|---|
| ObjectDetection | 단일 이미지에서 여러 객체를 현지화하고 식별합니다. | Tensorflow | 아파치 라이센스 |
| 마스크 R-CNN | 이 모델은 이미지의 객체의 각 인스턴스에 대해 경계 상자와 세분화 마스크를 생성합니다. 기능 피라미드 네트워크 (FPN) 및 RESNET101 백본을 기반으로합니다. | Tensorflow | MIT 라이센스 (MIT) |
| 더 빠른 RCNN | 이것은 더 빠른 RCNN의 실험적인 텐서 플로 구현입니다. 영역 제안 네트워크를 사용한 객체 감지를위한 CONVNET입니다. | Tensorflow | MIT 라이센스 |
| Yolo 텐서 플로우 | 이것은 Yolo : 실시간 객체 감지의 Tensorflow 구현입니다. | Tensorflow | 관습 |
| Yolo Tensorflow ++ | 'Yolo : 실시간 개체 감지'의 Tensorflow 구현, 교육 및 모바일 장치에서 실시간 실시간에 대한 실제 지원. | Tensorflow | GNU 일반 공개 라이센스 |
| Mobilenet | Mobilenets는 대기 시간, 크기 및 정확성 사이에서 트레이드 오프하면서 문헌에서 인기있는 모델과 호의적으로 비교합니다. | Tensorflow | MIT 라이센스 (MIT) |
| Deeplab | 시맨틱 이미지 세분화를위한 딥 라벨. | Tensorflow | 아파치 라이센스 |
| Colornet | 그레이 스케일 이미지를 채색하는 신경망. | Tensorflow | 찾을 수 없습니다 |
| Srgan | 생성 적대적 네트워크를 사용한 사진 현실 단일 이미지 초감각. | Tensorflow | 찾을 수 없습니다 |
| Deeposm | OpenStreetMap 기능 및 위성 이미지로 텐서 플로우 신경망을 훈련하십시오. | Tensorflow | MIT 라이센스 (MIT) |
| 도메인 전송 네트워크 | 감독되지 않은 크로스 도메인 이미지 생성 구현. | Tensorflow | MIT 라이센스 |
| 보여주고, 참석하고 말하십시오 | 주의 기반 이미지 캡션 생성기. | Tensorflow | MIT 라이센스 |
| 안드로이드 --언 | Tensorflow로 구동되는 Yolo Network를 사용하여 Android의 실시간 객체 감지. | Tensorflow | 아파치 라이센스 |
| DCSCN 슈퍼 해상도 | 이것은 딥 러닝 기반의 단일 이미지 수퍼 레벨 (SISR) 모델 인 네트워크의 스킵 연결 및 네트워크가있는 Deep CNN의 빠르고 정확한 이미지 슈퍼 해상도의 텐서 플로 구현입니다. | Tensorflow | 찾을 수 없습니다 |
| GAN-CLS | 이것은 합성 이미지의 실험적인 텐서 플로 구현입니다. | Tensorflow | 찾을 수 없습니다 |
| U-Net | 뇌종양 분할의 경우. | Tensorflow | 찾을 수 없습니다 |
| 개선 된 Cyclegan | 짝을 이루지 않은 이미지에서 이미지 번역. | Tensorflow | MIT 라이센스 |
| im2txt | 이미지 캡션을위한 이미지-텍스트 신경망. | Tensorflow | 아파치 라이센스 |
| 아주 적은 | TF-SLIM의 이미지 분류 모델. | Tensorflow | 아파치 라이센스 |
| 델프 | 이미지 일치 및 검색을위한 깊은 로컬 기능. | Tensorflow | 아파치 라이센스 |
| 압축 | 미리 훈련 된 잔차 GRU 네트워크를 사용하여 이미지를 압축 및 압축 압축합니다. | Tensorflow | 아파치 라이센스 |
| 주의력 | 실제 이미지 텍스트 추출을위한 모델. | Tensorflow | 아파치 라이센스 |
| 모델 이름 | 설명 | 뼈대 | 특허 |
|---|---|---|---|
| 마스크 R-CNN | 이 모델은 이미지의 객체의 각 인스턴스에 대해 경계 상자와 세분화 마스크를 생성합니다. 기능 피라미드 네트워크 (FPN) 및 RESNET101 백본을 기반으로합니다. | Keras | MIT 라이센스 (MIT) |
| vgg16 | 대규모 이미지 인식을위한 매우 깊은 컨볼 루션 네트워크. | Keras | MIT 라이센스 (MIT) |
| vgg19 | 대규모 이미지 인식을위한 매우 깊은 컨볼 루션 네트워크. | Keras | MIT 라이센스 (MIT) |
| RESNET | 이미지 인식을위한 깊은 잔류 학습. | Keras | MIT 라이센스 (MIT) |
| RESNET50 | 이미지 인식을위한 깊은 잔류 학습. | Keras | MIT 라이센스 (MIT) |
| NASNET | NASNET은 관심있는 데이터 세트에서 모델 아키텍처를 직접 학습하여 자동으로 설계된 모델 제품군 인 신경 아키텍처 검색 네트워크를 말합니다. | Keras | MIT 라이센스 (MIT) |
| Mobilenet | Keras의 Mobilenet V1 모델. | Keras | MIT 라이센스 (MIT) |
| Mobilenet V2 | Keras의 Mobilenet V2 모델. | Keras | MIT 라이센스 (MIT) |
| Mobilenet V3 | Keras의 Mobilenet V3 모델. | Keras | MIT 라이센스 (MIT) |
| 효율적인 넷 | 컨볼 루션 신경 네트워크를위한 모델 스케일링을 다시 생각합니다. | Keras | MIT 라이센스 (MIT) |
| 이미지 비유 | 신경 매칭 및 블렌딩을 사용하여 이미지 유사체를 생성합니다. | Keras | MIT 라이센스 (MIT) |
| 인기있는 이미지 분할 모델 | Keras에서 Segnet, FCN, UNET 및 기타 모델의 구현. | Keras | MIT 라이센스 |
| 초음파 신경 세분화 | 이 튜토리얼은 Keras 라이브러리를 사용하여 초음파 이미지 신경 세분화를위한 심층 신경망을 구축하는 방법을 보여줍니다. | Keras | MIT 라이센스 |
| DeepMask 객체 분할 | 이것은 DeepMask의 Keras 기반 Python 구현입니다. | Keras | 찾을 수 없습니다 |
| 단일 및 다국어 이미지 캡션 | 이것은 신경 시퀀스 모델과 함께 다국어 이미지 설명과 함께 제공되는 소스 코드입니다. | Keras | BSD-3-Clause 라이센스 |
| pix2pix | Keras는 Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A의 조건부 적대적 네트워크로 이미지 간 이미지 변환 구현 | Keras | 찾을 수 없습니다 |
| 다채로운 이미지 색상화 | B & W 색상. | Keras | 찾을 수 없습니다 |
| 사이클 간 | 사이클이 일관성있는 대적 네트워크를 사용하여 짝을 이루지 않은 이미지-이미지 변환 구현. | Keras | MIT 라이센스 |
| 이중간 | Dualgan의 구현 : 이미지 대 이미지 변환을위한 감독되지 않은 듀얼 학습 . | Keras | MIT 라이센스 |
| 수퍼 해상도 간 | 생성 적대적 네트워크를 사용하여 사진 현실 단일 이미지 초-해상도 구현. | Keras | MIT 라이센스 |
| 모델 이름 | 설명 | 뼈대 | 특허 |
|---|---|---|---|
| Detectron2 | Detctron2는 Facebook AI Research의 차세대 소프트웨어 시스템입니다. 최신 객체 탐지 알고리즘 | PyTorch | 아파치 라이센스 2.0 |
| FastPhotostyle | 사진 이미지 양식화를위한 폐쇄 형식 솔루션. | PyTorch | Creative Commons Attribution-Noncommercial-Sharealike 4.0 국제 공공 라이센스 |
| Pytorch-Cyclegan and-Pix2pix | 사진 이미지 양식화를위한 폐쇄 형식 솔루션. | PyTorch | BSD 라이센스 |
| Maskrcnn-Benchmark | 인스턴스 세분화 및 객체 감지 알고리즘의 빠른 모듈 식 참조 구현. | PyTorch | MIT 라이센스 |
| 심한 이미지를 선호합니다 | 신경망을 통한 이미지 복원은 학습없이. | PyTorch | 아파치 라이센스 2.0 |
| 스타건 | Stargan : 다중 도메인 이미지-이미지 변환을위한 통합 생성 적대 네트워크. | PyTorch | MIT 라이센스 |
| 더 빠른 rcnn.pytorch | 이 프로젝트는 더 빠른 R-CNN 구현으로 더 빠른 R-CNN 객체 감지 모델의 교육을 가속화하는 것을 목표로합니다. | PyTorch | MIT 라이센스 |
| pix2pixhd | 조건부 GANS로 2048x1024 이미지를 합성 및 조작. | PyTorch | BSD 라이센스 |
| 증강기 | 기계 학습을위한 파이썬의 이미지 확대 라이브러리. | PyTorch | MIT 라이센스 |
| 탈출 | 빠른 이미지 확대 라이브러리. | PyTorch | MIT 라이센스 |
| 깊은 비디오 분석 | Deep Video Analytics는 비디오 및 이미지에서 정보를 색인화하고 추출하는 플랫폼입니다. | PyTorch | 관습 |
| 시맨틱 세분화 파이터 | MIT ADE20K 데이터 세트에서 시맨틱 세분화/장면 구문 분석을위한 Pytorch 구현. | PyTorch | BSD 3-Clause 라이센스 |
| 이미지 기반 시퀀스 인식을위한 엔드 투 엔드 훈련 가능한 신경망 | 이 소프트웨어는 장면 텍스트 인식 및 OCR과 같은 이미지 기반 시퀀스 인식 작업을위한 CNN, RNN 및 CTC 손실의 조합 인 Convolutional Reburrent Neural Network (CRNN)를 구현합니다. | PyTorch | MIT 라이센스 (MIT) |
| 단위 | 감독되지 않은 이미지-이미지 변환을위한 결합 된 VAE-GAN 알고리즘의 Pytorch 구현. | PyTorch | Creative Commons Attribution-Noncommercial-Sharealike 4.0 국제 공공 라이센스 |
| 신경 서열 표지 모델 | 시퀀스 라벨링 모델은 이름이 지정된 엔티티 인식 (POS) 태그 및 워드 세분화와 같은 많은 NLP 작업에서 매우 인기가 있습니다. | PyTorch | 아파치 라이센스 |
| 더 빠른 RCNN | 이것은 더 빠른 RCNN의 Pytorch 구현입니다. 이 프로젝트는 주로 Py-Faster-RCNN 및 TFFRCNN을 기반으로합니다. R-CNN에 대한 자세한 내용은 더 빠른 R-CNN 용지를 참조하십시오 : Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun의 Shaoqing Ren의 Region 제안 네트워크를 사용한 실시간 객체 감지를 향해 참조하십시오. | PyTorch | MIT 라이센스 |
| Pytorch-semantic-세분화 | 시맨틱 세분화를위한 파이터. | PyTorch | MIT 라이센스 |
| EDSR-PYTORCH | 종이의 Pytorch 버전 '단일 이미지 초수는 단일 이미지를위한 강화 된 깊은 잔류 네트워크'. | PyTorch | MIT 라이센스 |
| 이미지 분류 모바일 | Imagenet-1K에서 사전에 분류 된 분류 모델 수집. | PyTorch | MIT 라이센스 |
| 페더 네트워크 | 페이더 네트워크 : 슬라이딩 속성으로 이미지 조작 -NIPS 2017. | PyTorch | Creative Commons Attribution-Noncommercial 4.0 국제 공공 라이센스 |
| NeuralTalk2-Pytorch | Pytorch의 이미지 캡션 모델 (_finetune이있는 분기의 Finetunable CNN). | PyTorch | MIT 라이센스 |
| 랜드 와이 렌 | 구현 : "이미지 인식을위한 무작위로 유선 신경망 탐색". | PyTorch | 찾을 수 없습니다 |
| 스태 건 -V2 | STACKGAN_V2를 재현하기위한 PyTorch 구현은 종이 스택 간 ++를 초래합니다. | PyTorch | MIT 라이센스 |
| 객체 감지를위한 디스크로 모델 | 이 코드를 사용하면 Pytorch와의 Facebook AI Research의 객체 감지에 일부 Detectron 모델을 사용할 수 있습니다. | PyTorch | 아파치 라이센스 |
| Dextr-Pytorch | 이 논문은 이미지 및 비디오에 대한 정확한 객체 분할을 얻기위한 입력으로 객체 (왼쪽, 가장 오른쪽, 가장 오른쪽, 상단, 하단 픽셀)에서 극단 점을 사용합니다. | PyTorch | GNU 일반 공개 라이센스 |
| pointnet.pytorch | "Pointnet : 3D 분류 및 세분화를위한 포인트 세트의 딥 러닝. | PyTorch | MIT 라이센스 |
| self-critical.pytorch | 이 저장소에는 이미지 캡션을위한 비공식 구현 자체 비판적 시퀀스 교육이 포함되어 있으며 이미지 캡션 및 시각적 질문 응답을위한 하향식 및 하향식주의가 포함됩니다. | PyTorch | MIT 라이센스 |
| vnet.pytorch | V-NET를위한 Pytorch 구현 : 부피의 의료 이미지 세분화를위한 완전 컨볼 루션 신경망. | PyTorch | BSD 3-Clause 라이센스 |
| 파이 와이즈 | Pytorch를 사용한 VOC2012 데이터 세트의 픽셀 별 세그먼트. | PyTorch | BSD 3-Clause 라이센스 |
| pspnet-pytorch | PSPNET 세분화 네트워크의 PyTorch 구현. | PyTorch | 찾을 수 없습니다 |
| Pytorch-Srresnet | 생성 적대자 네트워크를 사용한 사진 현실 단일 이미지 초수는 수퍼 레벨을위한 Pytorch 구현. | PyTorch | MIT 라이센스 (MIT) |
| pnasnet.pytorch | imagenet에서 pnasnet-5의 Pytorch 구현. | PyTorch | 아파치 라이센스 |
| img_classification_pk_pytorch | 이미지 분류 모델을 최신 모델과 빠르게 비교하십시오. | PyTorch | 찾을 수 없습니다 |
| 깊은 신경 네트워크는 쉽게 속입니다 | 인식 할 수없는 이미지에 대한 높은 신뢰 예측. | PyTorch | MIT 라이센스 |
| pix2pix-pytorch | "조건부 적대적 네트워크를 사용한 이미지-이미지 변환"의 Pytorch 구현. | PyTorch | 찾을 수 없습니다 |
| NVIDIA/시맨틱 세분화 | CVPR2019에서 비디오 전파 및 라벨 이완을 통한 시맨틱 세분화 개선의 Pytorch 구현. | PyTorch | CC By-NC-SA 4.0 라이센스 |
| 신경 이미지 평가 | 신경 이미지 평가의 Pytorch 구현. | PyTorch | 찾을 수 없습니다 |
| Torchxrayvision | 흉부 X- 선 (CXR) 병리학 예측에 대한 사전 모델. 의료, 건강 관리, 방사선학 | PyTorch | 아파치 라이센스 |
| Pytorch-Image 모델 | Pytorch 이미지 모델, 스크립트, 사전 손상된 가중치-(SE) RESNET/RESNEXT, DPN, EXECIONNET, MIXNET, MOBILENET-V3/V2, MNASNET, SIGLE PATH NAS, FBNET 등 | PyTorch | 아파치 라이센스 2.0 |
| 모델 이름 | 설명 | 뼈대 | 특허 |
|---|---|---|---|
| 개방 | Openpose는 단일 이미지에서 인체, 손 및 얼굴 키포 인 (총 130 개의 키패 인)을 공동으로 감지하는 최초의 실시간 다중 인 시스템을 나타냅니다. | Caffe | 관습 |
| 시맨틱 세분화를위한 완전 컨볼 루션 네트워크 | 시맨틱 세분화를위한 완전 컨볼 루션 모델. | Caffe | 찾을 수 없습니다 |
| 다채로운 이미지 색상화 | 다채로운 이미지 색상화. | Caffe | BSD-2-Clause 라이센스 |
| R-FCN | R-FCN : 지역 기반 완전 컨볼 루션 네트워크를 통한 객체 감지. | Caffe | MIT 라이센스 |
| CNN-VIS | Google의 최근 Inceptionism 블로그 게시물에서 영감을 얻은 CNN-Vis는 컨볼 루션 신경망을 사용하여 이미지를 생성 할 수있는 오픈 소스 도구입니다. | Caffe | MIT 라이센스 (MIT) |
| deconvnet | 시맨틱 세분화를위한 Deconvolution 네트워크 학습. | Caffe | 관습 |
| 모델 이름 | 설명 | 뼈대 | 특허 |
|---|---|---|---|
| 더 빠른 RCNN | 지역 제안 네트워크는 회귀 문제로 객체 감지를 해결합니다. | MXNet | Apache 라이센스, 버전 2.0 |
| SSD | SSD는 단일 네트워크로 객체 감지를위한 통합 프레임 워크입니다. | MXNet | MIT 라이센스 |
| 더 빠른 RCNN+초점 손실 | 코드는 밀도가 높은 객체 감지의 초점 손실에 대한 비공식 버전입니다. | MXNet | 찾을 수 없습니다 |
| CNN-LSTM-CTC | 텍스트 인식을위한 세 가지 모델을 알고 있으며, 모두 텍스트 이미지에 대한 세분화를 실현하기 위해 CTC 손실 계층으로 구성됩니다. | MXNet | 찾을 수 없습니다 |
| 더 빠른 _rcnn_for_dota | 이것은 Paper DOTA의 공식 리포지토리입니다. 공중 이미지에서 객체 감지를위한 대규모 데이터 세트입니다 . | MXNet | 아파치 라이센스 |
| RETINANET | 조밀 한 물체 감지를위한 초점 손실. | MXNet | 찾을 수 없습니다 |
| Mobilenetv2 | 이것은 종이 역전 잔차 및 선형 병목 현상 : 분류, 탐지 및 세분화를위한 모바일 네트워크 에 설명 된 Mobilenetv2 아키텍처의 MXNet 구현입니다. | MXNet | 아파치 라이센스 |
| 뉴런 선택성 전환 | 이 코드는 논문에서 imageNet 분류 실험을 재 구현 한 것입니다 . | MXNet | 아파치 라이센스 |
| Mobilenetv2 | 이것은 종이 역전 잔차 및 선형 병목 현상 : 분류, 탐지 및 세분화를위한 모바일 네트워크 에 설명 된 Mobilenetv2 아키텍처의 글루온 구현입니다. | MXNet | 아파치 라이센스 |
| 드문 구조 선택 | 이 코드는 심층 신경 네트워크를위한 종이 데이터 중심 스파 스 구조 선택 에서 ImageNet 분류 실험을 재 구현 한 것입니다. | MXNet | 아파치 라이센스 |
| FastPhotostyle | 사진 이미지 양식화를위한 폐쇄 형식 솔루션. | MXNet | Creative Commons Attribution-Noncommercial-Sharealike 4.0 국제 공공 라이센스 |
당신의 기여는 항상 환영합니다 !! contributing.md 를 살펴보십시오
MIT 라이센스