Probieren Sie Deep Learning -Modelle online auf Colab mit einem einzigen Klick aus.
TTS
- Eine englische weibliche Stimme (LJSpeech) -Demo mit Nvidia/Tacotron2 und Nvidia/Wellenlow
- Libritts trainierte Multi -Lautsprecher -TTS -Demo mit Nvidia/Flowtron
- Eine englische Demo der weiblichen Stimme (ljspeech) mit Rayhane-Mamah/Tacotron-2 und R9Y9/Wavenet_vocoder
- Eine mongolische männliche Sprachdemo mit Rayhane-Mamah/Tacotron-2 mit dem Griffin-Lim-Algorithmus
- Eine englische Demo für weibliche Stimme (LJSpeech) mit Tugstugi/Pytorch-dc-tts mit dem Griffin-Lim-Algorithmus
- Eine englische weibliche Stimme (ljspeech) -Demo mit Fatchord/Rege (Tacotron + Regenn)
- Eine englische weibliche Stimme (ljspeech) -Demo mit Mozilla/TTS (Tacotron + Raernn)
- Nvidia/Mellotron Notebook
- Sprachklondemo mit Corentinj/Echtzeit-Voice-Kloning
- Offizielles ESPNET -englisch/chinesischer/japanischer TTS -Notizbuch
- Offizielles Vorwärtstacotron ljspeech TTS Notebook
Spracherkennung
- Mozilla/Deepspeech mit LM auf YouTube -Videos
- Wav2Letter+ von Nvidia/OpenSQ2SEQ ohne LM auf YouTube -Videos
- Jasper von Nvidia/OpenSeq2Seq ohne LM auf YouTube -Videos
- Quarznet von Nvidia/Nemo ohne LM auf YouTube -Videos
- Quarznet von Nvidia/Nemo ohne LM mit Mikrofon
- Citrinet aus Nvidia/Nemo ohne LM mit Mikrofon
- Offizielles ESPNET Spanier-> Englisch Sprachübersetzung Notizbuch
- Englisch/Deutsch/Spanien Silero Spracherkennung mit Snakers4/Silero-Modellen
Objekterkennung
- Erkennung von Tensorflow -Objekt: Fastropusrcnn+InceptionResnet und SSD+Mobilenet
- Cascade RCNN-Demo mit Open-MMLAB/MMDERTEKTIONSE
- Yolo-Demo mit Ayooshkathuria/Pytorch-Yolo-V3
- Objekterkennung auf YouTube -Videos unter Verwendung von AmdeGroot/SSD.Pytorch (SSD300)
- Mask RCNN Demo mit Matterport/mask_rcnn
- Maske RCNN -Demo mit DETECTRON
- Offizielle Masken -RCNN -Demo von DETECTRON2
- Maske RCNN -Demo aus Torchvision
- Centernet (Objekte als Punkte) Demo mit Xingyizhou/Centernet
- CENTERNET (Objekte als Punkte) 3D -Autometion -Demo mit Xingyizhou/Centernet
- Funktioniert nur auf einem Kitti -Bild wegen Kameraparametern
- Offizielles DE⫶TR Demo Notebook Facebookresearch/DETR
- Offizielles Google EfficientDet Notebook
Segmentierung
- Für Mask RCNN siehe Objekterkennung
- Semantische Segmentierung, die auf ADE20K unter Verwendung von CSAilvision/Semantic-Segmentation-Pytorch ausgebildet ist
- Deeptlabv3 aus Torchvision
- Schnelle Verfolgung und Segmentierung mit Siammask auf YouTube -Videos
- Semantische Echtzeit-Segmentierung mit LightNet ++ auf YouTube-Videos
- Echtzeit-Instanzsegmentierung mit Yolact auf YouTube-Videos
- Instanzsegmentierung mit Centermaske
Multi -Objektverfolgung
- Fußgängerverfolgung mit ZQPEI/Deep_Sort_Pytorch (DeepSort + yolov3)
Erkennung von Posen
- Auf YouTube -Videos eingestellt
- Alphapose auf YouTube -Videos
- Dichtung des Demo -Notizbuchs
- HRNET Verwenden Sie LXY5513/HRNET auf YouTube -Videos
- Tastoint-R-CNN aus Torchvision
Szene Texterkennung
- Pixellink Demo Notebook
- Szene Texterkennung mit Argman/East
- Szene Texterkennung mit Bastelpytorch
Gan
- Biggan großes GaN -Training für High Fidelity Natürliche Bildsynthese
- Enttäuschung: Ein tiefes Lernbasis zum Färben und Wiederherstellen alter Bilder
- ein Bild entlasten
- Ein Video entlasten
- Generiert ein sprechendes Gesichtsvideo aus einem Bild und ein Audio mit Rudrabha/Lipgan
- Impuls: Selbstbewertetes Foto-Up-Sampling durch latente Raumforschung generativer Modelle
Miser
- Zeitlupe mit Avinashpaliwal/Super-Slomo auf YouTube-Videos
- Finetune GPT2 AK9250/GPT-2-Colab
- Musikquellen-Trennung sigsep/open-unmix-pytorch
- Bild Super-Auflösung Idealo/Image-Super-Auflösung
- Bewegungsmodell erster Ordnung für Bildanimation Aliaksandrsiarhrin/Model erster Ordnung
- Offizielles Notizbuch der 3D-Fotografie unter Verwendung von kontextbewussten Schichttiefe Inpainting VT-VL-Lab/3D-Photo-Inpainting
- Bild-GPT-Notizbuch
- Hintergrundmatting: Die Welt ist Ihr grüner Bildschirm Senguptaumd/Hintergrund-Matting