Archivo de la Versión 1: showow_langchain_report.py (mantenido en repose para los casos de usabilidad)
Archivo de la Versión 2: showow_langchain_report_with_audio.py (¡más nuevo y mejor!)
Shallow_langchain_report_with_audio combina la primera versión con implementaciones de código para admitir archivos de audio. Por lo tanto, ahora puede ejecutar la versión 2 para enviar un archivo de audio (M4A, etc.), y creará un archivo .txt titulado, "audio_generated_text.txt" en el mismo directorio. ¡A partir de ahí, leerá ese archivo .txt y producirá un informe resumido sobre el contenido! ¿No es esta lo más genial?
Todavía se llama "superficial", porque el backend aún no se ha implementado, lo que resulta en que su salida a menudo se corta (la ventana de contexto es demasiado grande para la salida de IA). Esto se resolverá en la versión 2, con un backend de Pinecone para ayudar a proporcionar sesiones más largas. ¡Estén atentos para la versión 3!
Descargue los archivos .py clonando el repositorio, o como desee.
Luego, encuentre la función LLM_initialization (la llamada de función es la primera línea en Main) y pegue su tecla API OpenAI en el campo de texto que dice "SK -...."
El único otro requisito de uso es proporcionarle un archivo de audio como entrada del usuario. Lo hemos probado en archivos .m4a, que son archivos de la aplicación "Memos de voz" en iPhones. Otras pruebas y soporte del tipo de archivo que vendrán más adelante.
Esta herramienta es parte de la iniciativa de desarrollo de herramientas AI de Blueprint. Comuníquese con ellos: LinkedIn
Línea de tiempo del proyecto: 15 de junio de 2023 - 27 de julio de 2023