Téléchargement nix tts - Téléchargement du code source nix tts

nix tts

Code Source AI

1.0.0

Télécharger

? Nix-tts

Texte à la dissection léger et de bout en bout via la distillation par module

Rendi Chevi, Radityo Eko Prasojo, Alham Fikri Aji, Andros Tjandra, Sakriani Sakti

Ceci est un référentiel pour notre article , ? NIX-TTS (accepté à IEEE SLT 2022). Nous avons publié les modèles pré-entraînés, une démo interactive et des échantillons audio ci-dessous.

[[? Lien papier] (à venir!)] [? Démo interactif] [? Échantillons audio]

Résumé Plusieurs solutions pour les TTS légères ont montré des résultats prometteurs. Pourtant, ils comptent soit sur une conception fabriquée à la main qui atteint la taille non optimale ou utilise une recherche d'architecture neuronale mais subit souvent des coûts de formation. Nous présentons Nix-TTS, un TTS léger atteint via la distillation des connaissances à un modèle de professeur TTS de haute qualité mais de grande taille, non autorégressif et de bout en bout (sans vocodeur). Plus précisément, nous offrons une distillation par module, permettant une distillation flexible et indépendante au module de l'encodeur et du décodeur. Le NIX-TTS résultant a hérité des propriétés avantageuses d'être non autorégressive et de bout en bout de l'enseignant, mais de taille nettement plus petite, avec seulement 5,23 millions de paramètres ou jusqu'à 89,34% de réduction du modèle de l'enseignant; Il réalise également plus de 3,04 $ Times $ et 8,36 $ Times $ inférence accélère respectivement sur le processeur Intel-I7 et la framboise PI 3B respectivement et conserve toujours un naturel et une intelligence de voix équitable par rapport au modèle des enseignants.

Début avec Nix-Tts

Clone le référentiel nix-tts et passer à son répertoire

git clone https://github.com/rendchevi/nix-tts.git
cd nix-tts

Installer les dépendances

Installez les dépendances Python. Nous recommandons python >= 3.8

pip install -r requirements.txt

Installez ESPEAK dans votre appareil (pour la tokenisation texte).

sudo apt-get install espeak

Ou suivez l'instruction officielle au cas où cela ne fonctionnerait pas.

Téléchargez votre modèle pré-formé choisi ici .

Modèle	Num. de paramètres	Plus rapide que le temps réel ^* (CPU Intel-I7)	Plus rapide que le temps réel ^* (Raspi Model 3B)
NIX-TTS (ONNX)	5,23 m	11.9x	0,50x
NIX-TTS avec durée stochastique (ONNX)	6,03 m	10.8x	0,50x

^* Ici, nous calculons à quel point le modèle fonctionne plus rapidement que le temps réel en tant que facteur inverse du facteur en temps réel (RTF). La table complète de tous les modèles accélérera sur le papier.

Et exécuter Nix-TTS est aussi simple que:

 from nix . models . TTS import NixTTSInference
from IPython . display import Audio

# Initiate Nix-TTS
nix = NixTTSInference ( model_dir = "<path_to_the_downloaded_model>" )
# Tokenize input text
c , c_length , phoneme = nix . tokenize ( "Born to multiply, born to gaze into night skies." )
# Convert text to raw speech
xw = nix . vocalize ( c , c_length )

# Listen to the generated speech
Audio ( xw [ 0 , 0 ], rate = 22050 )

Reconnaissance

Cette recherche est entièrement et exclusivement financée par Kata.ai, où les auteurs travaillent dans le cadre de l'équipe de recherche Kata.ai.
Certaines des parties complexes de notre modèle, comme mentionné dans l'article, sont adaptées de la mise en œuvre d'origine de VITS et de transformateur complet.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-25
taille 5.23KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Informations en anglais sur le développement vocal (TTS User Guide Delphi version)

2009-05-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout