Unduh NATSpeech - Unduh Kode Sumber NATSpeech

NATSpeech

Kode Sumber AI

v0.1

Unduh

NATSPEECH: Kerangka kerja teks-ke-kebiasaan non-otefresif

| | 中文文档

Repo ini berisi implementasi Pytorch resmi dari:

Portaspeech: Text-to-speech generatif portabel dan berkualitas tinggi (Neurips 2021)
Halaman demo | Huggingface? Demo
Diffsinger: Sintesis Suara Bernyanyi melalui Mekanisme Difusi Dangkal (Diffspeech) (AAAI 2022)
Halaman demo | Halaman Proyek | Huggingface? Demo

Fitur utama

Kami mengimplementasikan fitur -fitur berikut dalam kerangka ini:

Pemrosesan data untuk teks-ke-speech non-autoregresif menggunakan Montreal Forced Aligner.
Kerangka kerja yang nyaman dan dapat diskalakan untuk pelatihan dan inferensi.
Implementasi dataset akses acak yang sederhana namun efisien.

Instal dependensi

 # # We tested on Linux/Ubuntu 18.04. 
# # Install Python 3.6+ first (Anaconda recommended).

export PYTHONPATH=.
# build a virtual env (recommended).
python -m venv venv
source venv/bin/activate
# install requirements.
pip install -U pip
pip install Cython numpy==1.19.1
pip install torch==1.9.0 # torch >= 1.9.0 recommended
pip install -r requirements.txt
sudo apt install -y sox libsox-fmt-mp3
bash mfa_usr/install_mfa.sh # install forced alignment tool

Dokumen

Tentang kerangka kerja
Jalankan portaspeech
Jalankan difspeech

Kutipan

Jika Anda menemukan ini berguna untuk penelitian Anda, silakan kutip makalah berikut:

Portaspeech

 @article { ren2021portaspeech ,
  title = { PortaSpeech: Portable and High-Quality Generative Text-to-Speech } ,
  author = { Ren, Yi and Liu, Jinglin and Zhao, Zhou } ,
  journal = { Advances in Neural Information Processing Systems } ,
  volume = { 34 } ,
  year = { 2021 }
}

Diffspeech

 @article { liu2021diffsinger ,
  title = { Diffsinger: Singing voice synthesis via shallow diffusion mechanism } ,
  author = { Liu, Jinglin and Li, Chengxi and Ren, Yi and Chen, Feiyang and Liu, Peng and Zhao, Zhou } ,
  journal = { arXiv preprint arXiv:2105.02446 } ,
  volume = { 2 } ,
  year = { 2021 }
 }

Ucapan Terima Kasih

Kode kami dipengaruhi oleh repo berikut:

Petir Pytorch
Parallelwavegan
Hifi-gan
Espnet
Glow-tts
Diffspeech

Lisensi dan Perjanjian

Setiap organisasi atau individu dilarang menggunakan teknologi apa pun yang disebutkan dalam makalah ini untuk menghasilkan pidato seseorang tanpa persetujuannya, termasuk tetapi tidak terbatas pada para pemimpin pemerintah, tokoh politik, dan selebriti. Jika Anda tidak mematuhi item ini, Anda bisa melanggar undang -undang hak cipta.

Memperluas

Informasi Tambahan

Versi v0.1
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-14
ukuran 179.02KB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua