Descargar nix tts - Descargar código fuente de nix tts

nix tts

Código Fuente de IA

1.0.0

Descargar

? Nix-tts

Texto a voz liviano y de extremo a extremo a través de la destilación de módulos

Rendi Chevi, Radityo Eko Prasojo, Alham Fikri Aji, Andros Tjandra, Sakriani Sakti

Este es un repositorio de nuestro documento , ? NIX-TTS (aceptado para IEEE SLT 2022). Lanzamos los modelos previos a la aparición, una demostración interactiva y muestras de audio a continuación.

[[? Enlace en papel] (¡Próximamente!)] [? Demostración interactiva] [? Muestras de audio]

Resumen Varias soluciones para TTS livianos han mostrado resultados prometedores. Aún así, confían en un diseño hecho a mano que alcanza el tamaño no óptimo o usa una búsqueda de arquitectura neural, pero a menudo sufren costos de capacitación. Presentamos NIX-TTS, un TTS ligero logrado a través de la destilación de conocimiento a un modelo de maestro TTS de alta calidad pero de gran tamaño, no autorregresivo y de extremo a extremo (sin vocoder). Específicamente, ofrecemos destilación en forma de módulo, que permite la destilación flexible e independiente al módulo de codificador y decodificador. Los NIX-TTS resultantes heredaron las propiedades ventajosas de no ser autorregreses y de extremo a extremo del maestro, pero significativamente menor en tamaño, con solo 5.23m parámetros o una reducción de hasta 89.34% del modelo del maestro; También logra más de 3.04 $ veces $ y 8.36 $ veces $ aceleración de inferencia en CPU Intel-I7 y Raspberry Pi 3B respectivamente y aún conserva una naturalidad e inteligibilidad de voz justa en comparación con el modelo de maestro.

Comenzando con Nix-TTS

Clon el repositorio nix-tts y muévase a su directorio

git clone https://github.com/rendchevi/nix-tts.git
cd nix-tts

Instalar las dependencias

Instale dependencias de Python. Recomendamos python >= 3.8

pip install -r requirements.txt

Instale espeak en su dispositivo (para tokenización de texto).

sudo apt-get install espeak

O siga la instrucción oficial en caso de que no funcionara.

Descargue su modelo pre-capacitado elegido aquí .

Modelo	Numer de parámetros	Más rápido que en tiempo real ^* (CPU Intel-i7)	Más rápido que en tiempo real ^* (Raspi Model 3B)
NIX-TTS (ONNX)	5.23 m	11.9x	0.50x
NIX-TTS con duración estocástica (ONNX)	6.03 m	10.8x	0.50x

^* Aquí calculamos cuánto se ejecuta el modelo más rápido que el tiempo real como el inverso del factor en tiempo real (RTF). La tabla completa de todos los modelos se detalla en el papel.

Y ejecutar Nix-TTS es tan fácil como:

 from nix . models . TTS import NixTTSInference
from IPython . display import Audio

# Initiate Nix-TTS
nix = NixTTSInference ( model_dir = "<path_to_the_downloaded_model>" )
# Tokenize input text
c , c_length , phoneme = nix . tokenize ( "Born to multiply, born to gaze into night skies." )
# Convert text to raw speech
xw = nix . vocalize ( c , c_length )

# Listen to the generated speech
Audio ( xw [ 0 , 0 ], rate = 22050 )

Reconocimiento

Esta investigación es financiada plena y exclusivamente por Kata.ai, donde los autores trabajan como parte del equipo de investigación de Kata.ai.
Algunas de las partes complejas de nuestro modelo, como se menciona en el documento, se adaptan a la implementación original de VIT y TTS de transformador integral.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-25
tamaño 5.23KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Información en inglés sobre desarrollo de voz (Guía del usuario TTS versión Delphi)

2009-05-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo