Transcreva o áudio via API de fala do Google para o texto com separação de alto -falantes (diarização). Gerar automaticamente conjuntos de dados TTS usando áudio e texto associado. Usa a API do Google para transcrever cortes que foram divididos pela quebra máxima de silêncio (recomendada). Ou use oeneas para forçar o alinhamento de texto ao áudio. Revise rapidamente e edite cortes.
Para a API do Discurso do Google, você precisará de uma conta do Google Cloud Platform. Sua variável Env O Google está oferecendo US $ 300 em serviço e 3 meses gratuitos em novas contas.
Execute ferramentas.py para ferramentas da GUI.
As limitações atuais são que você precisará ajustar a largura da coluna da seção de revisão e, ao navegar nas entradas, você deve retirar o foco das caixas de texto atual e da próxima entrada ou a caixa de texto não será atualizada. A próxima versão do Dearpy GUI resolverá esses problemas.
O uso de uma VPN interferirá com os longos discursos do Google para enviar solicitações de API.


Usando a versão mais antiga do DearPygui no Momement, vou migrar eventualmente.
pip install numpy --user
pip install pydub -user
pip install DearPyGui == 0.6.415 -User
pip install google-cloud-speol
PIP Instale o Google-Cloud-Storage-User
Pip install SimpleAudio -User
*Se você não pode construir SimpleAudio, certifique-se de instalar o GCC: sudo apt-get update, sudo apt-get de instalação de construção-essenciais
Pip Install Sox -User
O ambiente Linux é recomendado para a opção AENEAS, no Windows Enéias não poderá fazer cortes mais longos devido a problemas de memória.
wget https://raw.githubusercontent.com/readbeyond/aeneas/master/install_dependencies.sh
Bash install_dependences.sh
pip install numpy --user
Pip Instale Enéias -User
Instalação de teste: python -m aeneas.diagnostics
pip install pydub -user
pip install DearPyGui == 0.6.415 -User
pip install google-cloud-speol
PIP Instale o Google-Cloud-Storage-User
Pip install SimpleAudio -User
Pip Install Sox -User
Se você receber o erro libpython:
sudo apt install libasound2-dev
Edite seu arquivo BASHRC digitando: sudo nano ~/.bashrc
Em seguida, adicione a linha no final com suas informações, dependendo de onde o seu pacote foi instalado:
exportar ld_library_path = "/[yourhomepath]/anaconda3/Envs/[yeeenv]/lib/"
OU
exportar ld_library_path = "/[yourhomePath]/.
Ou se o ambiente de base
exportar ld_library_path = "/[yourhomepath]/anaconda3/lib/"
Pressione Ctrl+O para exportar o arquivo atualizado. Em seguida, Ctrl+X para sair.
Digite fonte ~/.bashrc para ativar o novo caminho.
Tutorial em vídeo: https://www.youtube.com/watch?v=te7pui2xeje
Várias coisas melhorarão a qualidade de seus cortes, embora você sempre as revise antes do treinamento. Para outros idiomas que não o inglês, você pode editar facilmente as linhas de comando AENEAS e substituições de caracteres à sua necessidade e substituir os códigos do Google En-Us Languages pelo seu código de idioma (https://cloud.google.com/speech-to-text/docs/languages). Examine se coisas como os títulos dos capítulos estão incluídos. Os alto -falantes com fala lenta e uniformes farão os cortes mais limpos, enquanto os alto -falantes de ritmo acelerado tendem a executar palavras juntos e podem causar algumas palavras, peças de palavras, a serem transferidas para o próximo corte onde terá que ser editado. Remova toda a música se puder.