Unduh nix tts - Unduh Kode Sumber nix tts

nix tts

Kode Sumber AI

1.0.0

Unduh

? Nix-tts

Teks-ke-end-to-end-speech melalui distilasi modul-bijaksana

Rendi Chevi, Radityo Eko Prasojo, Alham Fikri Aji, Andros Tjandra, Sakriani Sakti

Ini adalah repositori untuk makalah kami , ? NIX-TTS (diterima untuk IEEE SLT 2022). Kami merilis model pretrained, demo interaktif, dan sampel audio di bawah ini.

[[? Tautan kertas] (segera hadir!)] [? Demo interaktif] [? Sampel audio]

Abstrak Beberapa solusi untuk TT ringan telah menunjukkan hasil yang menjanjikan. Namun, mereka mengandalkan desain kerajinan tangan yang mencapai ukuran yang tidak optimal atau menggunakan pencarian arsitektur saraf tetapi sering menderita biaya pelatihan. Kami menyajikan NIX-TTS, TTS ringan yang dicapai melalui distilasi pengetahuan ke model guru TTS berkualitas tinggi namun besar, non-autoregresif, dan ujung ke ujung (bebas vokoder). Secara khusus, kami menawarkan distilasi modul-bijaksana, memungkinkan distilasi yang fleksibel dan independen ke modul encoder dan decoder. NIX-TT yang dihasilkan mewarisi sifat menguntungkan menjadi non-autoregresif dan ujung-ke-ujung dari guru, namun secara signifikan lebih kecil, dengan hanya 5,23m parameter atau hingga 89,34% pengurangan model guru; Ini juga mencapai lebih dari 3,04 $ kali $ dan 8,36 $ kali $ Inferensi Speedup pada CPU Intel-I7 dan Raspberry Pi 3B masing-masing dan masih mempertahankan kealamian dan kejelasan suara yang adil dibandingkan dengan model guru.

Memulai dengan NIX-TTS

Klon Repositori nix-tts dan Pindah ke Direktori

git clone https://github.com/rendchevi/nix-tts.git
cd nix-tts

Instal dependensi

Pasang dependensi Python. Kami merekomendasikan python >= 3.8

pip install -r requirements.txt

Instal Espeak di perangkat Anda (untuk tokenisasi teks).

sudo apt-get install espeak

Atau ikuti instruksi resmi jika tidak berhasil.

Unduh model pra-terlatih yang Anda pilih di sini .

Model	Num. Params	Lebih cepat dari waktu nyata ^* (CPU Intel-I7)	Lebih cepat dari waktu nyata ^* (model raspi 3b)
NIX-TTS (ONNX)	5.23 m	11.9x	0,50x
NIX-TTS W/ Durasi Stokastik (ONNX)	6.03 m	10.8x	0,50x

^* Di sini kita menghitung seberapa banyak model berjalan lebih cepat daripada real-time sebagai kebalikan dari real time factor (RTF). Tabel lengkap dari semua model speedup dirinci di atas kertas.

Dan menjalankan NIX-TTS semudah:

 from nix . models . TTS import NixTTSInference
from IPython . display import Audio

# Initiate Nix-TTS
nix = NixTTSInference ( model_dir = "<path_to_the_downloaded_model>" )
# Tokenize input text
c , c_length , phoneme = nix . tokenize ( "Born to multiply, born to gaze into night skies." )
# Convert text to raw speech
xw = nix . vocalize ( c , c_length )

# Listen to the generated speech
Audio ( xw [ 0 , 0 ], rate = 22050 )

Pengakuan

Penelitian ini sepenuhnya dan eksklusif didanai oleh Kata.ai, di mana penulis bekerja sebagai bagian dari tim peneliti Kata.ai.
Beberapa bagian kompleks dari model kami, sebagaimana disebutkan dalam makalah, diadaptasi dari implementasi asli VIT dan transformer-TTS yang komprehensif.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-25
ukuran 5.23KB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Informasi bahasa Inggris tentang pengembangan suara (Panduan Pengguna TTS versi Delphi)

2009-05-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua