download annotate_audio - annotate_audio download de código fonte

annotate_audio

Código-Fonte de IA

1.0.0

Baixar

Anotar áudio

Esses scripts auxiliares do Python ajudam você a obter arquivos de áudio anotados menores, de um grande arquivo de áudio contendo, para treinar modelos STT ou TTS, por: 1. Dividir o arquivo grande em vários arquivos WAV menores, separados por silêncio. Se houver vários alto -falantes no seu áudio, você também poderá remover as peças faladas pelo (s) alto (s) alto (s) alto (s). 2. (Opcional) Obtenha transcrição para esses arquivos de áudio menores do serviço do Google Cloud STT, isso requer uma conta GCP 3. Anotar manualmente (ou correto anotações do GCP) os arquivos de áudio menores

Instalação

A etapa 1 exige que o FFMPEG seja instalado no seu sistema.
Todos os scripts estão escritos no Python 3.6+, os pacotes necessários podem ser instalados com:

 pip install -r requirement.txt

Você precisará de Pyaudio para a Etapa 3.

Além disso, se você quiser usar o STT do GCP, deve instalar o cliente Python com

 pip install --upgrade google-cloud-speech

e configure um projeto como mostrado aqui.
A versão atual deste script é compatível com o Google-Cloud -peech 2.x, se você deseja usar a versão 1.x, poderá dar uma olhada nas versões anteriores deste repositório que também usavam essa versão.

Uso

 python split.py --input big_file.wav --audio_folder audio --out_csv sentences.csv

O arquivo sentenças.csv será formado como "FILE; sentença".
Para manter apenas os arquivos falados por um alto-falante em particular, use os argumentos "--remove_bad_segments" e "-speaker_segment".

 python get_gcp_transcription.py --audio_folder audio --csv sentences.csv --language_code en-US

 python annotate.py --audio_folder audio --csv sentences.csv

Para todos os três scripts, você pode ver argumentos adicionais com

 python FILE_NAME.py -h

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-14
tamanho 6.71KB
Vindo de Github

Aplicativos Relacionados

nspanel_pro_tools_apk

2024-11-12
audio share

2024-11-02
Versão gratuita do aplicativo de edição de áudio

2024-01-11
Aplicativo de áudio Heylink

2023-07-28
Mac de áudio

2023-07-18
Áudio mack clipe de música versão Android

2023-07-17

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos