Essayez les modèles d'apprentissage en profondeur en ligne sur Colab en un seul clic.
Tts
- Une démo de voix féminine anglaise (LJSpeech) utilisant Nvidia / Tacotron2 et Nvidia / Wave Glow
- Demo TTS multi-haut-parleur formé Libritts Utilisation de Nvidia / Flowtron
- Une démo de voix féminine anglaise (LJSpeech) utilisant Rayhane-Mamah / Tacotron-2 et R9Y9 / Wavenet_VoDer
- Une démo de voix masculine mongole utilisant Rayhane-Mamah / Tacotron-2 avec l'algorithme Griffin-Lim
- Une démo de voix féminine anglaise (LJSpeech) utilisant Tugstugi / Pytorch-DC-TTS avec l'algorithme Griffin-LIM
- Une démo de voix féminine anglaise (LJSpeech) utilisant Fatchord / Wavernn (Tacotron + Wavernn)
- Une démo de voix féminine anglaise (LJSpeech) utilisant Mozilla / TTS (Tacotron + Wavernn)
- Carnet Nvidia / Mellotron
- Démo de clone vocal utilisant corentinj / voice en temps réel
- Notebook officiel ESPNET English / Chinese / Japony TTS
- Note de carnet officiel de Forwardtacotron LJSpeech TTS
Reconnaissance de la parole
- Mozilla / DeepSpeech avec LM sur des vidéos YouTube
- Wav2letter + de Nvidia / OpenSeq2Seq sans LM sur des vidéos YouTube
- Jasper de Nvidia / OpenSeq2Seq sans LM sur des vidéos YouTube
- Quartznet de Nvidia / Nemo sans LM sur des vidéos YouTube
- Quartznet de Nvidia / Nemo sans LM avec microphone
- Citrinet de Nvidia / Nemo sans LM avec microphone
- ESPNET ESPNET Espagnol-> Note de traduction de la parole en anglais
- Anglais / allemand / Espagne Reconnaissance de la parole SILERO avec Snakers4 / SILERO-MODELS
Détection d'objet
- Détection d'objets TensorFlow: plus rapide
- Démo RCNN Cascade Utilisation de MMLAB / MMDETOBLE Open
- Démo yolo utilisant l'ayoshkathuria / pytorch-yolo-v3
- Détection d'objet sur les vidéos YouTube à l'aide d'AMDegroot / ssd.pytorch (SSD300)
- Mask RCNN Demo Utilisation de Matterport / Mask_Rcnn
- Masque démo RCNN à l'aide de Detectron
- Démo RCNN Mask officiel de Detectron2
- Masque RCNN Demo de TorchVision
- Centernet (objets comme points) Demo à l'aide de Xingyizhou / Centernet
- Centernet (objets comme points) Demo de détection de voiture 3D Utilisation de Xingyizhou / Centernet
- Fonctionne uniquement sur une image Kitti en raison des paramètres de la caméra
- Note de démo de de⫶tr officiel FacebookResearch / DETR
- Note de carnet officiel de Google EfficientDet
Segmentation
- Pour Mask RCNN, voir la détection d'objets
- Segmentation sémantique formée sur ADE20K à l'aide de CSAILVision / Semantic-Segmentation-Pytorch
- DeepLabv3 de TorchVision
- Suivi rapide et segmentation avec Siammask sur des vidéos YouTube
- Segmentation sémantique en temps réel avec LightNet ++ sur des vidéos YouTube
- Segmentation des instances en temps réel avec Yolact sur des vidéos YouTube
- Segmentation des instances avec Centermask
Suivi de plusieurs objets
- Suivi des piétons à l'aide de ZQPEI / DEEP_SORT_PYTORCH (DeepSort + Yolov3)
Détection de pose
- OpenPose sur des vidéos YouTube
- Alphapose sur des vidéos YouTube
- Cahier de démonstration denseSpose
- HRNET utilisant LXY5513 / HRNET sur des vidéos YouTube
- KeyPoint R-CNN de TorchVision
Détection de texte de la scène
- Cahier de démonstration de pixellink
- Détection de texte de la scène à l'aide d'Argman / East
- Détection de texte de la scène à l'aide d'artisanat-pytorch
Gan
- Formation de Gan à grande échelle à grande échelle pour la synthèse d'image naturelle haute fidélité
- Deoltify: un projet basé sur l'apprentissage en profondeur pour colorer et restaurer d'anciennes images
- déentifier une image
- déentifier une vidéo
- Génère une vidéo de visage parlante à partir d'une image et d'un audio à l'aide de Rudrabha / Lipgan
- Pulse: Ups échantillonnage de photo auto-levé via l'exploration de l'espace latent des modèles génératifs
Mission
- Ralenti en utilisant Avinashpaliwal / Super-Slomo sur des vidéos YouTube
- Finetune GPT2 AK9250 / GPT-2-Colab
- Séparation de source de musique Sigsep / Open-UNMIX-PYTORCH
- Image Super Resolution Idealo / Image-Super-Resolution
- Modèle de mouvement de premier ordre pour l'animation d'image Aliaksandrsiarohin / Model de premier ordre
- Note à note officielle de photographie 3D utilisant une profondeur de profondeur de contexte de contexte VT-VL-LAB / 3D-Photo-intainting
- Cahier d'image-gpt
- Matting de fond: le monde est votre écran vert senguptaumd / fond de fond