Интерфейс браузера на основе Gradio для Whisper. Вы можете использовать его в качестве простого генератора субтитра!

Если вы хотите попробовать это на Colab, вы можете сделать это здесь!
Приложение может работать с Pinokio.
http://localhost:7860 . Установите и запустите Docker-Desktop.
Git клонировать репозиторий
git clone https://github.com/jhj0517/Whisper-WebUI.gitdocker compose build docker compose uphttp://localhost:7860 При необходимости обновите docker-compose.yaml чтобы соответствовать вашей среде.
Чтобы запустить этот WebUI, вам нужно иметь git , 3.10 <= python <= 3.12 , FFmpeg .
И если вы не используете графический процессор NVIDA или не используете другую версию CUDA , чем 12.4, отредактируйте requirements.txt в соответствии с вашей средой.
Пожалуйста, перейдите по ссылкам ниже, чтобы установить необходимое программное обеспечение:
3.10 ~ 3.12 рекомендуется. После установки FFMPEG, обязательно добавьте папку FFmpeg/bin в свой путь!
git clone https://github.com/jhj0517/Whisper-WebUI.gitinstall.bat или install.sh для установки зависимостей. (Это создаст каталог venv и установит там зависимости.)start-webui.bat или start-webui.sh (он будет запускать python app.py после активации Venv)И вы также можете запустить проект с аргументами командной строки, если хотите, см. Вики для руководства по аргументам.
Этот проект интегрирован с быстрее по умолчанию для лучшего использования VRAM и скорости транскрипции.
Согласно быстрее, эффективность оптимизированной модели шепота заключается в следующем:
| Выполнение | Точность | Размер луча | Время | Максимум Память графического процессора | Максимум Память процессора |
|---|---|---|---|---|---|
| Openai/Whisper | FP16 | 5 | 4M30S | 11325 МБ | 9439 МБ |
| быстрее | FP16 | 5 | 54 с | 4755 МБ | 3244MB |
Если вы хотите использовать реализацию, отличную от быстрее, используйте --whisper_type arg и имя репозитория.
Прочитайте Wiki для получения дополнительной информации о CLI Args.
Это оригинальный таблица использования VRAM от Whisper для моделей.
| Размер | Параметры | Модель только на английском языке | Многоязычная модель | Требуется VRAM | Относительная скорость |
|---|---|---|---|---|---|
| крошечный | 39 м | tiny.en | tiny | ~ 1 ГБ | ~ 32x |
| база | 74 м | base.en | base | ~ 1 ГБ | ~ 16x |
| маленький | 244 м | small.en | small | ~ 2 ГБ | ~ 6x |
| середина | 769 м | medium.en | medium | ~ 5 ГБ | ~ 2x |
| большой | 1550 м | N/a | large | ~ 10 ГБ | 1x |
.en Модели предназначены только для английского, и что круто то, что вы можете использовать опцию « Translate to English из «больших» моделей!
Любые PRS, которые переводят язык в перевод. YAML будет очень ценится!