Resumen del habla
Esta aplicación de línea de transmisión permite a los usuarios cargar un archivo de audio, transcribir el audio utilizando Whisper ASR de OpenAI y luego resumir la transcripción utilizando el modelo de idioma GPT-3.5-turbo de OpenAI.
Características
- Subir archivos de audio en formatos compatibles (M4A, MP3, WebM, MP4, MPGA, WAV y MPEG)
- Transcribir audio usando Whisper asr de OpenAi
- Resumir el audio transcrito utilizando el GPT-3.5-TURBO de Openai
- Proporcione la tecla API personalizada y seleccione el modelo deseado
Instalación
Requisitos previos
- Python 3.6 o superior
- Racionalizar
- Biblioteca Operai Python (V0.27.0 o superior)
Pasos
- Clon el repositorio:
git clone https://github.com/StanGirard/speechdigest
- Cambiar en el directorio del repositorio:
- Instale los paquetes requeridos:
pip install -r requirements.txt
- Establezca su tecla API OpenAI como una variable de entorno:
export OPENAI_API_KEY="your-api-key"
- Ejecute la aplicación Streamlit:
La aplicación ahora se puede acceder en http://localhost:8501 en su navegador.
Uso
- Abra la aplicación en su navegador.
- Ingrese su tecla API OpenAI y seleccione el modelo deseado (GPT-4 o GPT-3.5-TURBO) utilizando los campos de entrada.
- Cargue un archivo de audio en un formato compatible con el cargador de archivos.
- La aplicación transcribirá el audio usando Whisper ASR y mostrará la transcripción.
- La aplicación resumirá la transcripción utilizando el modelo de idioma seleccionado y mostrará el resumen.
Que contribuye
No dude en enviar problemas, solicitudes de funciones o solicitudes de extracción. Apreciamos cualquier contribución para mejorar la aplicación.