Discurso digestão
Este aplicativo StryPlit permite que os usuários enviem um arquivo de áudio, transcreva o áudio usando o Whisper ASR do OpenAI e resuma a transcrição usando o modelo de linguagem GPT-3.5-turbo do OpenAI.
Características
- Carregue arquivos de áudio em formatos suportados (M4A, MP3, WebM, MP4, MPGA, WAV e MPEG)
- Transcrever áudio usando o Whisper ASR do OpenAi
- Resumir o áudio transcrito usando o GPT-3.5-turbo do OpenAI
- Forneça a chave da API personalizada e selecione o modelo desejado
Instalação
Pré -requisitos
- Python 3.6 ou superior
- Simplit
- Openai Python Library (v0.27.0 ou superior)
Passos
- Clone o repositório:
git clone https://github.com/StanGirard/speechdigest
- Mude no diretório do repositório:
- Instale os pacotes necessários:
pip install -r requirements.txt
- Defina sua chave da API OpenAI como uma variável de ambiente:
export OPENAI_API_KEY="your-api-key"
- Execute o aplicativo StreamLit:
O aplicativo agora estará acessível em http://localhost:8501 no seu navegador.
Uso
- Abra o aplicativo em seu navegador.
- Digite sua tecla API OpenAI e selecione o modelo desejado (GPT-4 ou GPT-3.5-Turbo) usando os campos de entrada.
- Carregue um arquivo de áudio em um formato suportado usando o uploader de arquivo.
- O aplicativo transcreverá o áudio usando o Whisper ASR e exibirá a transcrição.
- O aplicativo resumirá a transcrição usando o modelo de idioma selecionado e exibirá o resumo.
Contribuindo
Sinta -se à vontade para enviar questões, solicitações de recursos ou solicitações. Agradecemos qualquer contribuição para melhorar o aplicativo.