Versão 1 Arquivo: Shallow_langchain_report.py (mantido no repositório para casos de usabilidade)
Versão 2 Arquivo: Shallow_langchain_report_with_audio.py (mais recente e melhor!)
Shallow_Langchain_report_with_audio combina a primeira versão com implementações de código para suportar arquivos de áudio. Assim, agora você pode executar a versão 2 para enviar um arquivo de áudio (M4A, etc) e criará um arquivo .txt intitulado "Audio_Generated_Text.txt" no mesmo diretório. A partir daí, ele lerá esse arquivo .txt e produzirá um relatório resumido sobre o conteúdo! Isso não é a coisa mais legal de todos os tempos?
Ainda é nomeado "raso", porque o back -end ainda não foi implementado - o que resulta na sua saída geralmente sendo cortada (a janela de contexto é grande demais para a saída da IA). Isso será resolvido na versão 2, com um back -end pinecone para ajudar a fornecer sessões mais longas. Fique atento à versão 3!
Faça o download dos arquivos .py clonando o repositório ou como você possa desejar.
Em seguida, encontre a função LLM_Initialization (a chamada de função é a primeira linha em Main) e cole sua chave da API do OpenAI no campo de texto que diz: "SK-..."
O único outro requisito de uso é fornecer um arquivo de áudio como entrada do usuário. Nós o testamos em arquivos .m4a, que são arquivos do aplicativo "Voice Memos" nos iPhones. Outros testes de arquivo e suporte de fileType para vir mais tarde.
Esta ferramenta faz parte da iniciativa de desenvolvimento de ferramentas da AI da Blueprint. Alcance para eles: LinkedIn
Cronograma do projeto: 15 de junho de 2023 - 27 de julho de 2023