1回のクリックでColabでオンラインでディープラーニングモデルを試してみてください。
TTS
- nvidia/tacotron2とnvidia/wavglowを使用した英語の女性の声(ljspeech)デモ
- Librittsは、Nvidia/Flowtronを使用してマルチスピーカーTTSデモを訓練しました
- Rayhane-Mamah/Tacotron-2およびR9Y9/Wavenet_Vocoderを使用した英語の女性の声(ljspeech)デモ
- Griffin-LimアルゴリズムでRayhane-Mamah/Tacotron-2を使用したモンゴルの男性の声のデモ
- Griffin-Limアルゴリズムを使用してTugstugi/Pytorch-DC-TTSを使用した英語の女性の声(ljspeech)デモ
- Fatchord/Wavernn(Tacotron + Wavernn)を使用した英語の女性の声(ljspeech)デモ
- Mozilla/TTS(Tacotron + Wavernn)を使用した英語の女性の声(ljspeech)デモ
- Nvidia/Mellotronノートブック
- Corentinj/Real-Time-Voice-Cloningを使用した音声クローンデモ
- 公式ESPNET英語/中国/日本のTTSノートブック
- 公式フォワードタコトロンljspeech TTSノートブック
音声認識
- YouTubeビデオにLMを備えたMozilla/Deepspeech
- YouTubeビデオにLMなしでnvidia/openseq2seqからのwav2letter+
- YouTubeビデオにLMなしのNvidia/Openseq2SeqのJasper
- YouTubeビデオでLMなしのNvidia/NemoのQuartznet
- nvidia/nemoからのquartznet lm with microphone
- マイク付きLMなしのNvidia/Nemoからのシトリネット
- 公式ESPNETスペイン語 - >英語の音声翻訳ノートブック
- Snakers4/Silero-Modelsを使用した英語/ドイツ/スペインシレロの音声認識
オブジェクトの検出
- Tensorflowオブジェクトの検出:FasterRcnn+InceptionResnetおよびSSD+MobileNet
- OpenMMLab/MMDeTectionを使用したCascade RCNNデモ
- Ayooshkathuria/Pytorch-Yolo-V3を使用したYoloデモ
- amdegroot/ssd.pytorch(SSD300)を使用したYouTubeビデオでのオブジェクト検出
- Matterport/mask_rcnnを使用したMASK RCNNデモ
- Detectronを使用したRCNNデモをマスクします
- Detectron2の公式マスクRCNNデモ
- TorchvisionのRCNNデモをマスク
- centernet(ポイントとしてのオブジェクト)xingyizhou/centernetを使用したデモ
- centernet(ポイントとしてのオブジェクト)xingyizhou/centernetを使用した3Dカー検出デモ
- カメラのパラメーターのためにキッティ画像でのみ動作します
- 公式de⫶trデモノートブックFacebookResearch/Detr
- Googleの公式EfficientDetノートブック
セグメンテーション
- マスクRCNNについては、オブジェクトの検出を参照してください
- Csailvision/Semantic-Segmentation-Pytorchを使用してADE20Kでトレーニングされたセマンティックセグメンテーション
- TorchvisionのDeeplabv3
- YouTubeビデオのSiammaskを使用した高速追跡とセグメンテーション
- YouTubeビデオのLightNet ++を使用したリアルタイムセマンティックセグメンテーション
- YouTubeビデオでYolactを使用したリアルタイムインスタンスセグメンテーション
- センターマスクによるインスタンスセグメンテーション
マルチオブジェクトトラッキング
- ZQPEI/DEEP_SORT_PYTORCHを使用した歩行者追跡(DeepSort + Yolov3)
ポーズ検出
- YouTubeビデオでOpenPosity
- YouTubeビデオのアルファポース
- DENCERPOSESデモノートブック
- YouTubeビデオでLXY5513/HRNETを使用したHRNET
- TorchvisionのキーポイントR-CNN
シーンテキストの検出
- Pixellinkデモノートブック
- Argman/Eastを使用したシーンテキストの検出
- Craft-Pytorchを使用したシーンテキストの検出
ガン
- 高忠実度のためのビッグガン大規模GANトレーニング自然画像合成
- Deoldify:古い画像の色付けと復元のための深い学習ベースのプロジェクト
- Rudrabha/Lipganを使用して、画像とオーディオからトーキングフェイスビデオを生成します
- パルス:生成モデルの潜在的な宇宙探査による自己監視写真アップサンプリング
その他
- YouTubeビデオでAvinashpaliwal/Super-Slomoを使用したスローモーション
- Finetune GPT2 AK9250/GPT-2-COLAB
- 音楽ソース分離sigsep/open-unmix-pytorch
- 画像スーパー解像度理想的/画像スーパー解像度
- 画像アニメーションALIAKSANDRSIAROHIN/1次モデルの一次モデルモデル
- VT-VL-LAB/3D-Photo-inpaintingの入力インペインティングインペインティングのコンテキスト認識レイヤード深度を使用した3D写真の公式ノートブック
- Image-GPTノートブック
- バックグラウンドマット:世界はあなたの緑の画面であり、senguptaumd/background mattingです