Речевая дайджест
Это приложение Streamlit позволяет пользователям загружать аудиофайл, транскрибировать звук, используя Whisper ASR Openai, а затем суммирует транскрипцию с помощью языковой модели GPT-3.5-Turbo от OpenAI.
Функции
- Загрузить аудиофайлы в поддерживаемых форматах (M4A, MP3, WebM, MP4, MPGA, WAV и MPEG)
- Транскрибируйте аудио с использованием шепота Apenai ASR
- Суммируйте транскрибированную аудио с использованием GPT-3.5-Turbo от Openai
- Предоставьте пользовательский ключ API и выберите желаемую модель
Установка
Предварительные условия
- Python 3.6 или выше
- Поток
- Библиотека Python Openai (v0.27.0 или выше)
Шаги
- Клонировать репозиторий:
git clone https://github.com/StanGirard/speechdigest
- Переодеться в каталог хранилища:
- Установите необходимые пакеты:
pip install -r requirements.txt
- Установите свой ключ API OpenAI в качестве переменной среды:
export OPENAI_API_KEY="your-api-key"
- Запустите приложение Streamlit:
Приложение теперь будет доступно по адресу http://localhost:8501 в вашем браузере.
Использование
- Откройте приложение в своем браузере.
- Введите ключ API OpenAI и выберите нужную модель (GPT-4 или GPT-3.5-Turbo), используя входные поля.
- Загрузите аудиофайл в поддерживаемый формат, используя загрузчик файла.
- Приложение будет транскрибировать звук, используя Whisper ASR и отобразит транскрипцию.
- Затем приложение суммирует транскрипцию, используя выбранную языковую модель и отобразит резюме.
Внося
Не стесняйтесь отправлять проблемы, запросы на функции или запросы. Мы ценим любой вклад в улучшение приложения.