한 번의 클릭으로 Colab에서 온라인으로 딥 러닝 모델을 사용해보십시오.
TTS
- nvidia/tacotron2 및 nvidia/waveglow를 사용한 영어 여성 음성 (LJSpeech) 데모
- Libritts는 NVIDIA/FLOWTRON을 사용하여 다중 스피커 TTS 데모를 훈련시킵니다
- Rayhane-Mamah/Tacotron-2 및 R9y9/Wavenet_vocoder를 사용한 영어 여성 음성 (LJSpeech) 데모
- Griffin-LIM 알고리즘과 함께 Rayhane-Mamah/Tacotron-2를 사용한 몽골 남성 음성 데모
- Griffin-LIM 알고리즘이있는 Tugstugi/Pytorch-DC-TTS를 사용한 영어 여성 음성 (LJSpeech) 데모
- Fatchord/Wavernn (Tacotron + Wavernn)을 사용한 영어 여성 음성 (LJSpeech) 데모
- Mozilla/TTS (Tacotron + Wavernn)를 사용한 영어 여성 음성 (LJSpeech) 데모
- Nvidia/Mellotron 노트북
- Corentinj/Real-Time-Voice-Cloning을 사용한 음성 클론 데모
- 공식 ESPNET 영어/중국어/일본인 TTS 노트
- 공식 ForwardTacotron ljspeech tts 노트북
음성 인식
- YouTube 비디오에 LM이있는 Mozilla/DeepSpeech
- YouTube 동영상에서 LM이없는 NVIDIA/OpenSeq2Seq의 WAV2LETTER+
- YouTube 동영상에서 LM이없는 NVIDIA/OpenSeq2Seq의 Jasper
- YouTube 비디오에서 LM이없는 NVIDIA/NEMO의 QuartzNet
- 마이크가있는 LM이없는 NVIDIA/NEMO의 쿼츠 넷
- 마이크가있는 LM이없는 NVIDIA/NEMO의 Citrinet
- 공식 ESPNET 스페인어-> 영어 음성 번역 노트북
- Snakers4/Silero-Models와의 영어/독일/스페인 실로 음성 인식
물체 감지
- 텐서 플로우 객체 감지 : 더 빠른 RCNN+InceptionResnet 및 SSD+Mobilenet
- Open-MMLAB/MMDetection을 사용한 캐스케이드 RCNN 데모
- Ayooshkathuria/Pytorch-Nolo-V3를 사용한 Yolo 데모
- Amdegroot/ssd.pytorch (SSD300)를 사용한 YouTube 동영상의 객체 감지
- MatterPort/mask_rcnn을 사용하여 RCNN 데모를 마스크하십시오
- Detectron을 사용하여 RCNN 데모를 마스크하십시오
- Detectron2의 공식 마스크 RCNN 데모
- Torchvision에서 RCNN 데모를 마스크하십시오
- Xingyizhou/Centernet을 사용하는 센터넷 (객체 AS 포인트) 데모
- 센터넷 (객체 AS 포인트) Xingyizhou/Centernet을 사용한 3D 차량 감지 데모
- 카메라 매개 변수 때문에 Kitti 이미지에서만 작동합니다.
- 공식 DEbookTR 데모 노트북 FacebookResearch/Detr
- 공식 Google EnvicieldDet Notebook
분할
- 마스크 RCNN은 객체 감지를 참조하십시오
- Csailvision/Semantic-Sementation-Pytorch를 사용하여 ADE20K에서 훈련 된 시맨틱 세분화
- Torchvision의 Deeplabv3
- YouTube 동영상에서 Siammask로 빠른 추적 및 세분화
- YouTube 동영상에서 LightNet ++를 사용한 실시간 시맨틱 세분화
- YouTube 동영상에서 Yolact를 사용한 실시간 인스턴스 세분화
- Centermask를 통한 인스턴스 세분화
다중 객체 추적
- zqpei/deep_sort_pytorch를 사용한 보행자 추적 (DeepSort + Yolov3)
포즈 감지
- YouTube 동영상을 오픈하십시오
- YouTube 동영상의 알파스
- Densepose 데모 노트북
- YouTube 비디오에서 lxy5513/hrnet을 사용하는 HRNet
- Torchvision의 키패 포인트 R-CNN
장면 텍스트 감지
- Pixellink 데모 노트북
- Argman/East를 사용한 장면 텍스트 감지
- Craft-Pytorch를 사용한 장면 텍스트 감지
간
- 고 충실도 자연 이미지 합성을위한 대규모 간 훈련
- Deoldify : 오래된 이미지를 채색하고 복원하기위한 딥 러닝 기반 프로젝트
- Rudrabha/Lipgan을 사용하여 이미지와 오디오에서 말하는 얼굴 비디오를 생성합니다.
- 펄스 : 생성 모델의 잠재 우주 탐색을 통한 자체 감독 사진 업 샘플링
기타
- YouTube 비디오에서 Avinashpaliwal/Super-Slomo를 사용한 슬로우 모션
- FINETUNE GPT2 AK9250/GPT-2-COLAB
- 음악 소스 분리 SIGSEP/Open-Unmix-Pytorch
- 이미지 슈퍼 해상도 이상/이미지-슈퍼-해상도
- 이미지 애니메이션의 첫 번째 주문 모션 모델 Aliacsandrsiarohin/1 차 모델
- Context-Aware 계층 깊이를 사용한 3D 사진 공식 노트북 VT-VL-LAB/3D- 광자 인증
- Image-Gpt 노트북
- 배경 매트 : 세상은 녹색 화면 Senguptaumd/배경 매팅입니다