O Scribe é um script Python que transcreve arquivos de áudio usando o OpenAIi sussurram e exporta as transcrições como documentos em PDF, aprimorados pela API GPT-3.5-Turbo. Ele suporta formatos de arquivo MP3, M4A e MP4 como entrada e gera um arquivo PDF com o texto da transcrição formatado em uma página de tamanho A4. O script também utiliza o modelo GPT-3.5-turbo do OpenAI para gerar um título para a transcrição.
Recursos Converte os arquivos MP3, M4A e MP4 em formato WAV para transcrição Transcrição Arquivos de áudio usando o modelo Whisper ASR Gerar um título para a transcrição usando o modelo GPT-3.5-Turbo do OpenAI, crie um arquivo PDF com o texto da transcrição Formatted em uma página de tamanho A4 A4
Uso: python scriBev4.py <input_file>
Substitua <input_file> pelo caminho para o arquivo MP3, M4A ou MP4.
O script transcreverá o arquivo de áudio, gerará um título e criará um arquivo PDF no mesmo diretório que o arquivo de entrada com o mesmo nome, mas uma extensão .pdf.
Pré-requisitos:
Instalar sussurro: pip install git+https: //github.com/openai/whisper.git
Confira os diferentes modelos pré-treinados disponíveis e seu desempenho no Whisper's Github: https://github.com/openai/whisper
Instale outras dependências: PyDub OpenAi ReportLab Moviepy
O Diet Scribe usa a API OpenAI e produz um TXT.
Defina sua chave de API
Instale todas as dependências necessárias: pydub, Moviepy, OpenAI
Run: Python diet-scred.py <input_file>