Scribe es un script de Python que transcribe archivos de audio utilizando Operai Whisper y exporta las transcripciones como documentos PDF, mejorados por la API GPT-3.5-Turbo. Admite formatos de archivo MP3, M4A y MP4 como entrada y genera un archivo PDF con el texto de la transcripción formateado en una página de tamaño A4. El script también utiliza el modelo GPT-3.5-Turbo de OpenAI para generar un título para la transcripción.
Las características Convertir los archivos MP3, M4A y MP4 para WAV Formateo para la transcripción Transcribir archivos de audio utilizando el modelo Whisper ASR Genere un título para la transcripción utilizando el modelo GPT-3.5-Turbo de OpenAI Cree un archivo PDF con el texto de la transcripción formateado en una página de tamaño A4 personalice el estilo de la salida PDF, incluida la alineación de texto y el tamaño de la fuente de la fuente y el tamaño de la fuente
Uso: Python Scribev4.py <putpy_file>
Reemplace <input_file> con la ruta a su archivo mp3, m4a o mp4.
El script transcribirá el archivo de audio, generará un título y creará un archivo PDF en el mismo directorio que el archivo de entrada con el mismo nombre pero una extensión .pdf.
Requisitos previos:
Instalar Whisper: Pip Instalar git+https: //github.com/openai/whisper.git
Echa un vistazo a los diferentes modelos pre-entrenados disponibles y su rendimiento en Whisper's GitHub: https://github.com/openai/whisper
Instale otras dependencias: Pydub OpenAi ReportLab Moviepy
Diet Scribe utiliza la API de OpenAI y emite un TXT.
Establezca su tecla API
Instale todas las dependencias requeridas: Pydub, Moviepy, OpenAI
Run: Python Diet-Scribe.py <Put_file>