Файл версии 1: mellow_langchain_report.py (хранясь в репо для случая юзабилити)
Версия 2 Файл: mellow_langchain_report_with_audio.py (новейшая и самая лучшая!)
shellow_langchain_report_with_audio объединяет первую версию с реализациями кода для поддержки аудиофайлов. Таким образом, теперь вы можете запустить версию 2, чтобы отправить аудиофайл (M4A и т. Д.), И он создаст файл .txt под названием «Audio_Generated_text.txt» в том же каталоге. Оттуда он будет читать этот файл .txt и создавать суммированный отчет о контенте! Это не самая крутая вещь?
Он до сих пор называется «неглубоким», потому что бэкэнд еще не реализован, что приводит к тому, что ваш вывод часто вырезан (окно контекста слишком велик для вывода ИИ). Это будет решено в версии 2 с бэкендом Pinecone, чтобы помочь обеспечить более длительные сеансы. Оставайтесь с нами для версии 3!
Загрузите файлы .py, клонируя репо, или как вы можете пожелать.
Затем найдите функцию LLM_Initialization (вызов функции является первой строкой в основном) и вставьте свой ключ API OpenAI в текстовое поле с надписью «SK-i»
Единственным другим требованием использования является предоставление аудиофайла в качестве пользовательского ввода. Мы протестировали его на файлах .m4a, которые представляют собой файлы из приложения «Голосовые записки» на iPhone. Дальнейшее тестирование филетипов и поддержка придет позже.
Этот инструмент является частью инициативы по разработке инструментов AI Blueprint. Обратитесь к ним: LinkedIn
Сроки проекта: 15 июня 2023 г. - 27 июля 2023 г.