Download do nix tts - nix tts Download de código fonte

nix tts

Código-Fonte de IA

1.0.0

Baixar

? Nix-tts

Full-the-tim-times Text-to-fala através da destilação em termos de módulo

Rendi Chevi, Radityo Eko Prasojo, Alham Fikri Aji, Andros Tjandra, Sakriani Sakti

Este é um repositório para o nosso artigo ,? Nix-TTS (aceito no IEEE SLT 2022). Lançamos os modelos pré -ridicularizados, uma demonstração interativa e amostras de áudio abaixo.

[[? Link de papel] (em breve!)] [? Demo interativa] [? Amostras de áudio]

Resumo Várias soluções para TTs leves mostraram resultados promissores. Ainda assim, eles dependem de um design artesanal que atinge o tamanho que não é o ideal ou usa uma pesquisa de arquitetura neural, mas geralmente sofre custos de treinamento. Apresentamos o NIX-TTS, um TTS leve obtido por destilação de conhecimento para uma professora de alta qualidade, mas de grande porte, não autorregressiva e de ponta a ponta (sem vocoder) TTS. Especificamente, oferecemos destilação em termos de módulo, permitindo uma destilação flexível e independente para o codificador e o módulo decodificador. Os NIX-TTs resultantes herdaram as propriedades vantajosas de serem não autorregressivas e de ponta a ponta do professor, mas significativamente menores em tamanho, com apenas 5,23 milhões de parâmetros ou até 89,34% de redução do modelo do professor; Ele também atinge mais de 3,04 $ Times $ e 8,36 $ Times $ Speedup de Inferência na CPU Intel-I7 e Raspberry Pi 3b, respectivamente, e ainda mantém uma naturalidade e inteligibilidade de voz justas em comparação com o modelo de professor.

Introdução com nix-tts

Clone o repositório nix-tts e mude para seu diretório

git clone https://github.com/rendchevi/nix-tts.git
cd nix-tts

Instalar as dependências

Instale as dependências do Python. Recomendamos python >= 3.8

pip install -r requirements.txt

Instale Espeak no seu dispositivo (para tokenização de texto).

sudo apt-get install espeak

Ou siga a instrução oficial, caso não funcionasse.

Faça o download do seu modelo pré-treinado escolhido aqui .

Modelo	Num. de params	Mais rápido que em tempo real ^* (CPU Intel-I7)	Mais rápido que em tempo real ^* (Raspi Modelo 3b)
Nix-tts (onnx)	5,23 m	11.9x	0,50x
Nix-tts com duração estocástica (ONNX)	6.03 m	10.8x	0,50x

^* Aqui calculamos o quanto o modelo é mais rápido que o tempo real do fator de tempo real (RTF). A tabela completa de todos os modelos acelerando é detalhada no papel.

E executar o Nix-TTS é tão fácil quanto:

 from nix . models . TTS import NixTTSInference
from IPython . display import Audio

# Initiate Nix-TTS
nix = NixTTSInference ( model_dir = "<path_to_the_downloaded_model>" )
# Tokenize input text
c , c_length , phoneme = nix . tokenize ( "Born to multiply, born to gaze into night skies." )
# Convert text to raw speech
xw = nix . vocalize ( c , c_length )

# Listen to the generated speech
Audio ( xw [ 0 , 0 ], rate = 22050 )

Reconhecimento

Esta pesquisa é totalmente e exclusivamente financiada pela Kata.ai, onde os autores trabalham como parte da equipe de pesquisa Kata.ai.
Algumas das partes complexas do nosso modelo, como mencionado no artigo, são adaptadas da implementação original de Vits e do Transformer-TTS abrangente.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-25
tamanho 5.23KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Informações em inglês sobre desenvolvimento de voz (TTS User Guide versão Delphi)

2009-05-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos