Descargar annotate_audio - Descargar el código fuente annotate

annotate_audio

Código Fuente de IA

1.0.0

Descargar

Anotar audio

Estos scripts de Python Helper lo ayudan a obtener archivos de audio anotados más pequeños, desde un archivo grande que contiene audio, hasta modelos STT o TTS, por: 1. Divida el archivo grande en varios archivos WAV más pequeños, separados por el silencio. Si hay varios altavoces en su audio, también puede eliminar las piezas habladas por los otros (s) altavoz (s). 2. (Opcional) Obtenga una transcripción para estos archivos de audio más pequeños del servicio de Google Cloud STT, esto requiere una cuenta GCP 3. Anotar manualmente (o las anotaciones GCP correctas) los archivos de audio más pequeños

Instalación

El paso 1 requiere que FFMPEG instale en su sistema.
Todos los scripts están escritos en Python 3.6+, los paquetes requeridos se pueden instalar con:

 pip install -r requirement.txt

Necesitarás Pyaudio para el paso 3.

Además, si desea usar el STT de GCP, debe instalar su cliente Python con

 pip install --upgrade google-cloud-speech

y configure un proyecto como se muestra aquí.
La versión actual de este script es compatible con Google-Cloud-speech 2.x, si desea usar la versión 1.x, puede echar un vistazo a las versiones anteriores de este repositorio que también usó esa versión.

Uso

 python split.py --input big_file.wav --audio_folder audio --out_csv sentences.csv

El archivo Sentences.csv se formará como "archivo; oración".
Para mantener solo archivos hablados por un orador en particular, use los argumentos "---remove_bad_segments" y "--speaker_segment".

 python get_gcp_transcription.py --audio_folder audio --csv sentences.csv --language_code en-US

 python annotate.py --audio_folder audio --csv sentences.csv

Para los tres scripts, puede ver argumentos adicionales con

 python FILE_NAME.py -h

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-14
tamaño 6.71KB
Proviene de Github

Aplicaciones relacionadas

nspanel_pro_tools_apk

2024-11-12
audio share

2024-11-02
Versión gratuita de la aplicación de edición de audio

2024-01-11
Aplicación Heylink Audio

2023-07-28
audio mack

2023-07-18
Clip de música de audio mack versión de Android

2023-07-17

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo