Neural Voice Cloning With Few Samples unduh - Neural Voice Cloning With Few Samples pengunduhan kode sumber

Neural Voice Cloning With Few Samples

Kode Sumber AI

1.0.0

Unduh

Status : Arsip (kode disediakan apa adanya, tidak ada pembaruan yang diharapkan)

CAMPLE-NEURA-VOICE-CLONING-WITH-FEW-samples

Kami mencoba mengkloning suara untuk speaker yang konten independen. Ini berarti bahwa kita harus meraih identitas pembicara daripada konten yang mereka bicarakan. Kami mencoba melakukan ini dengan membuat speaker menanamkan ruang untuk speaker yang berbeda.

Embeddings pembicara mencoba mewakili identitas pembicara (berbagai aspek suara seperti nada, aksen, dll dari pembicara), Anda dapat menganggap ini sebagai sidik jari suara pembicara.

Kami sekarang mengacu pada makalah berikut untuk implementasi kami:-

"Kloning suara saraf dengan beberapa sampel" oleh Baidu

Status

Arsitektur untuk model generatif dan pembicara multi-speaker telah dibangun.

Model generatif multi-speaker telah dilatih untuk adaptasi speaker untuk 84 speaker menggunakan VCTK-Dataset telah selesai pada NVIDIA-V100 GPU untuk zaman 190000.

Adaatasi pembicara

Dataset VCTK dibagi untuk pelatihan dan pengujian: 84 pembicara digunakan untuk melatih model multi-speaker, 8 pembicara untuk validasi, dan 16 pembicara untuk kloning.

Pelatihan untuk adapatasi pembicara

Berikut ini akan melatih model pada 84 speaker pertama dalam dataset.

 python speaker_adaptation.py --data-root=<path_of_vctk_dataset> --checkpoint-dir=<path> --checkpoint-interval=<int>

Ini bisa memakan waktu hingga 20 jam menggunakan GPU.

Untuk mengadaptasi model ke pembicara tertentu setelah pelatihan awal

 python speaker_adaptation.py --data-root=<path_of_vctk_dataset> --restore-parts=<path_of_checkpoint> --checkpoint-dir=<path> --checkpoint-interval=<int>

Ini akan memakan rata -rata 10 hingga 20 menit.

Beberapa suara kloning

Sejauh ini beberapa suara kerucut yang kami miliki menggunakan tautan adaptasi pembicara

Ucapan Terima Kasih

Implementasi model generatif multi-speaker terinspirasi dari https://github.com/r9y9/deepvoice3_pytorch
Suara saraf kloning dengan beberapa sampel

Mengutip

Jika Anda menemukan kode di repositori yang berguna, silakan mengutipnya menggunakan:

 @misc{chitlangia2021voicecloning,
  author = {Chitlangia, Sharad and Rastogi, Mehul and Ganguly, Rijul},
  title = {An Open Source Implementation of Neural Voice Cloning With Few Samples},
  year = {2021},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {Available at url{https://github.com/SforAiDl/Neural-Voice-Cloning-With-Few-Samples/} or url{https://github.com/Sharad24/Neural-Voice-Cloning-With-Few-Samples/}},
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-20
ukuran 42.14MB
Berasal dari Github

Aplikasi Terkait

azure search python samples

2024-11-05
GLM 4 Voice

2024-11-02
Retrieval based Voice Conversion WebUI

2024-11-01
terjebak dengan Jester

2024-02-23
Versi Neural Cloud Android

2022-11-24
Kami Bahagia Sedikit

2022-09-05

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua