Scribe-это скрипт Python, который транскрибирует аудиофайлы с использованием шепота Openai и экспортирует транскрипции в качестве документов PDF, усиленных API GPT-3.5-Turbo. Он поддерживает форматы файлов MP3, M4A и MP4 в качестве ввода и генерирует файл PDF с текстом транскрипции, отформатированным на странице размера A4. Сценарий также использует модель Openai GPT-3.5-Turbo для создания заголовка для транскрипции.
Функции конвертировать файлы mp3, M4A и MP4 в формат WAV для транскрипции транскрибирования аудиофайлов с использованием модели Whisper ASR.
Использование: Python scribev4.py <point_file>
Замените <Input_file> на путь к вашему файлу MP3, M4A или MP4.
Скрипт будет транскрибировать аудиофайл, генерировать заголовок и создаст файл PDF в том же каталоге, что и входной файл с тем же именем, но расширение .pdf.
Предварительные условия:
Установите Whisper: PIP установить git+https: //github.com/openai/whisper.git
Проверьте различные доступные предварительно обученные модели и их производительность на Github's Whisper: https://github.com/openai/whisper
Установите другие зависимости: pydub Open Reportlab MoviePy
Диета Scribe использует API OpenAI и выводит TXT.
Установите свой ключ API
Установите все необходимые зависимости: pydub, moviepy, openai
Запустите: Python Diet-scribe.py <point_file>