Обертка API для библиотеки Whisperx
Это приложение FASTAPI, которое обеспечивает конечную точку для транскрипции видео/аудио с использованием команды whisperx . Приложение поддерживает несколько аудио и видео форматов. Он выполняет транскрипцию, выравнивание и дневник загруженных медиа -файлов.
Следуйте инструкциям о том requirements.txt как установить Whisperx в официальном репозитории.
pip install -r requirements.txt Создайте файл .env в корневом каталоге и добавьте следующие переменные:
SECRET_KEY = your_secret_key
MASTER_KEY = your_master_key
HUGGING_FACE_TOKEN = your_hugging_face_token
API_PORT = 11300 SQLite используется для хранения информации пользователя. База данных создается автоматически при запуске приложения.
Запустите приложение, используя:
python api_whisperx.py Замените main на имя вашего файла Python, если он не main.py
/authАутентифицируйте пользователя и верните токен JWT.
username : имя пользователя пользователя.password : пароль пользователя./create_userСоздайте нового пользователя.
username : желаемое имя пользователя.password : желаемый пароль.master_key : мастер -ключ для авторизованного создания пользователей./whisperx-transcribe/Протекайте загруженный аудио или видеофайл.
file : аудио или видеофайл для транскрибирования.lang : Язык для транскрипции (по умолчанию «Pt»).model : модель для использования для транскрипции (по умолчанию «большой V2»).min_speakers : минимальное количество динамиков для дневника (по умолчанию 1).max_speakers : максимальное количество динамиков для дневника (по умолчанию 2). Приложение имеет встроенную регистрацию, которая сообщает о выполняемых шагах, и о любых возникающих ошибках.