ลองใช้รูปแบบการเรียนรู้ลึกออนไลน์บน colab ด้วยคลิกเดียว
TTS
- การสาธิตเสียงหญิงหญิงภาษาอังกฤษ (LJSpeech) โดยใช้ NVIDIA/TACOTRON2 และ NVIDIA/WAWGLOW
- Libritts ได้รับการฝึกฝนการสาธิต TTS Multi Speaker โดยใช้ nvidia/flowtron
- การสาธิตเสียงหญิงหญิงภาษาอังกฤษ (LJSpeech) โดยใช้ Rayhane-Mamah/Tacotron-2 และ R9Y9/WAVENET_VOCODER
- การสาธิตเสียงชายชาวมองโกเลียโดยใช้ Rayhane-Mamah/Tacotron-2 พร้อมอัลกอริทึม Griffin-Lim
- การสาธิตเสียงหญิงหญิงภาษาอังกฤษ (LJSpeech) โดยใช้ TugStugi/Pytorch-DC-TTS พร้อมอัลกอริทึม Griffin-Lim
- การสาธิตเสียงหญิงหญิงภาษาอังกฤษ (LJSpeech) โดยใช้ Fatchord/Wavernn (Tacotron + Wavernn)
- การสาธิตเสียงหญิงหญิงภาษาอังกฤษ (LJSpeech) โดยใช้ Mozilla/TTS (Tacotron + Wavernn)
- Nvidia/Mellotron Notebook
- การสาธิตเสียงโคลนโดยใช้ corentinj/เรียลไทม์-voice-cloning
- สมุดบันทึก TTS ภาษาอังกฤษ/จีน/จีนอย่างเป็นทางการ
- Forwardtacotron LjSpeech TTS อย่างเป็นทางการ
การรู้จำเสียงพูด
- Mozilla/DeepSpeech พร้อม LM บนวิดีโอ YouTube
- WAV2LETTER+ จาก NVIDIA/OPENSEQ2SEQ โดยไม่มี LM บนวิดีโอ YouTube
- Jasper จาก NVIDIA/OPENSEQU2SEQ โดยไม่มี LM ในวิดีโอ YouTube
- Quartznet จาก nvidia/nemo โดยไม่มี LM ในวิดีโอ YouTube
- Quartznet จาก Nvidia/Nemo โดยไม่มี LM พร้อมไมโครโฟน
- Citrinet จาก Nvidia/Nemo โดยไม่มี LM พร้อมไมโครโฟน
- สมุดบันทึกการแปลคำพูดภาษาอังกฤษอย่างเป็นทางการ
- การจดจำคำพูดภาษาอังกฤษ/เยอรมัน/สเปน Silero กับ Snakers4/Silero-Models
การตรวจจับวัตถุ
- การตรวจจับวัตถุ Tensorflow: Fasterrcnn+InceptionResnet และ SSD+Mobilenet
- การสาธิต Cascade RCNN โดยใช้ Open-MMLAB/MMDETECTION
- Yolo Demo โดยใช้ Ayooshkathuria/Pytorch-Yolo-V3
- การตรวจจับวัตถุในวิดีโอ YouTube โดยใช้ Amdegroot/SSD.pytorch (SSD300)
- การสาธิต RCNN MASK โดยใช้ Matterport/MASK_RCNN
- หน้ากาก rcnn demo โดยใช้ detectron
- การสาธิตหน้ากากอย่างเป็นทางการจาก Detectron2
- หน้ากาก RCNN Demo จาก Torchvision
- Centernet (วัตถุเป็นจุด) สาธิตโดยใช้ Xingyizhou/Centernet
- Centernet (วัตถุเป็นจุด) ตัวอย่างการตรวจจับรถยนต์ 3 มิติโดยใช้ Xingyizhou/Centernet
- ใช้งานได้เฉพาะกับภาพ Kitti เนื่องจากพารามิเตอร์กล้อง
- สมุดบันทึกการสาธิตDE⫶TRอย่างเป็นทางการ FacebookResearch/DETR
- สมุดบันทึกของ Google EfficientDet อย่างเป็นทางการ
การแบ่งส่วน
- สำหรับหน้ากาก RCNN ดูการตรวจจับวัตถุ
- การแบ่งส่วนความหมายที่ผ่านการฝึกอบรมเกี่ยวกับ ADE20K โดยใช้ CSAILVISION/SEMANTIC-SEGMENTATION-PYTORCH
- deeplabv3 จาก Torchvision
- การติดตามและแบ่งส่วนอย่างรวดเร็วด้วย Siammask บนวิดีโอ YouTube
- การแบ่งส่วนความหมายแบบเรียลไทม์กับ LightNet ++ บนวิดีโอ YouTube
- การแบ่งส่วนอินสแตนซ์แบบเรียลไทม์กับโยลค์บนวิดีโอ YouTube
- การแบ่งส่วนอินสแตนซ์ด้วย centermask
การติดตามวัตถุหลายรายการ
- การติดตามคนเดินเท้าโดยใช้ zqpei/deep_sort_pytorch (deepsort + yolov3)
การตรวจจับท่าทาง
- OpenPose on YouTube Videos
- Alphapose บนวิดีโอ YouTube
- สมุดบันทึกการสาธิต densepose
- HRNET โดยใช้ LXY5513/HRNET บนวิดีโอ YouTube
- Keypoint R-CNN จาก Torchvision
การตรวจจับข้อความฉาก
- Pixellink Demo Notebook
- การตรวจจับข้อความฉากโดยใช้ Argman/East
- การตรวจจับข้อความฉากโดยใช้ Craft-Pytorch
กาน
- การฝึกกานขนาดใหญ่ขนาดใหญ่สำหรับการสังเคราะห์ภาพธรรมชาติที่มีความเที่ยงตรงสูง
- Deoldify: โครงการที่ใช้การเรียนรู้อย่างลึกซึ้งสำหรับการระบายสีและการฟื้นฟูภาพเก่า ๆ
- deoldify ภาพ
- deoldify วิดีโอ
- สร้างวิดีโอใบหน้าพูดคุยจากภาพและเสียงโดยใช้ Rudrabha/Lipgan
- พัลส์: การสุ่มตัวอย่างภาพถ่ายที่ดูแลตัวเองผ่านการสำรวจอวกาศแฝงของรุ่น Generative
ผิด
- การเคลื่อนไหวช้าโดยใช้ avinashpaliwal/super-slomo บนวิดีโอ YouTube
- Finetune GPT2 AK9250/GPT-2-Colab
- การแยกแหล่งที่มาของเพลง sigsep/open-unmix-pytorch
- Image Super Resolution Idealo/Image-Super-Resolution
- แบบจำลองการเคลื่อนไหวลำดับแรกสำหรับภาพแอนิเมชั่นภาพ Aliaksandrsiarohin/รุ่นแรก
- สมุดบันทึกอย่างเป็นทางการของการถ่ายภาพ 3 มิติโดยใช้ความลึกของบริบทที่ตระหนักถึงความลึกในการสร้าง VT-VL-VL-LAB/3D-Photo-Inpainting
- สมุดบันทึกรูปภาพ GPT
- การปูพื้นหลัง: โลกคือหน้าจอสีเขียวของคุณ senguptaumd/การปูพื้นหลัง