TTS dataset tools Download - TTS dataset tools Código Fonte Download

TTS dataset tools

Código-Fonte de IA

1.0.0

Baixar

TTS-DataSet-Tools

Transcreva o áudio via API de fala do Google para o texto com separação de alto -falantes (diarização). Gerar automaticamente conjuntos de dados TTS usando áudio e texto associado. Usa a API do Google para transcrever cortes que foram divididos pela quebra máxima de silêncio (recomendada). Ou use oeneas para forçar o alinhamento de texto ao áudio. Revise rapidamente e edite cortes.

Para a API do Discurso do Google, você precisará de uma conta do Google Cloud Platform. Sua variável Env O Google está oferecendo US $ 300 em serviço e 3 meses gratuitos em novas contas.

Execute ferramentas.py para ferramentas da GUI.

As limitações atuais são que você precisará ajustar a largura da coluna da seção de revisão e, ao navegar nas entradas, você deve retirar o foco das caixas de texto atual e da próxima entrada ou a caixa de texto não será atualizada. A próxima versão do Dearpy GUI resolverá esses problemas.

O uso de uma VPN interferirá com os longos discursos do Google para enviar solicitações de API.

GUI do conjunto de dados

Usando a versão mais antiga do DearPygui no Momement, vou migrar eventualmente.

Configuração do Windows

pip install numpy --user

pip install pydub -user

pip install DearPyGui == 0.6.415 -User

pip install google-cloud-speol

PIP Instale o Google-Cloud-Storage-User

Pip install SimpleAudio -User

*Se você não pode construir SimpleAudio, certifique-se de instalar o GCC: sudo apt-get update, sudo apt-get de instalação de construção-essenciais

Pip Install Sox -User

Configuração do Linux

O ambiente Linux é recomendado para a opção AENEAS, no Windows Enéias não poderá fazer cortes mais longos devido a problemas de memória.

wget https://raw.githubusercontent.com/readbeyond/aeneas/master/install_dependencies.sh

Bash install_dependences.sh

pip install numpy --user

Pip Instale Enéias -User

Instalação de teste: python -m aeneas.diagnostics

pip install pydub -user

pip install DearPyGui == 0.6.415 -User

pip install google-cloud-speol

PIP Instale o Google-Cloud-Storage-User

Pip install SimpleAudio -User

Pip Install Sox -User

Se você receber o erro libpython:

sudo apt install libasound2-dev

Edite seu arquivo BASHRC digitando: sudo nano ~/.bashrc

Em seguida, adicione a linha no final com suas informações, dependendo de onde o seu pacote foi instalado:

exportar ld_library_path = "/[yourhomepath]/anaconda3/Envs/[yeeenv]/lib/"

OU

exportar ld_library_path = "/[yourhomePath]/.

Ou se o ambiente de base

exportar ld_library_path = "/[yourhomepath]/anaconda3/lib/"

Pressione Ctrl+O para exportar o arquivo atualizado. Em seguida, Ctrl+X para sair.

Digite fonte ~/.bashrc para ativar o novo caminho.

Uso

Tutorial em vídeo: https://www.youtube.com/watch?v=te7pui2xeje

Recomendações

Várias coisas melhorarão a qualidade de seus cortes, embora você sempre as revise antes do treinamento. Para outros idiomas que não o inglês, você pode editar facilmente as linhas de comando AENEAS e substituições de caracteres à sua necessidade e substituir os códigos do Google En-Us Languages pelo seu código de idioma (https://cloud.google.com/speech-to-text/docs/languages). Examine se coisas como os títulos dos capítulos estão incluídos. Os alto -falantes com fala lenta e uniformes farão os cortes mais limpos, enquanto os alto -falantes de ritmo acelerado tendem a executar palavras juntos e podem causar algumas palavras, peças de palavras, a serem transferidas para o próximo corte onde terá que ser editado. Remova toda a música se puder.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-15
tamanho 430.01KB
Vindo de Github

Aplicativos Relacionados

language tools

2024-11-11
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
biliLive tools

2024-11-03
F5 TTS ComfyUI

2024-11-02
sra tools

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos