Whisper-это система распознавания речи с открытым исходным кодом, разработанная Openai
Содержимое
- Официальный
- Модельные варианты
- Приложения
- Веб -приложения
- CLI Инструменты
- Детские площадки
- Пакеты
- Статьи
- Видео
- Сообщество
- Сторонние API
- Связанные списки
Официальный
- Введение
- Исходный код
- Белая бумага
Модельные варианты
- Whisper.cpp - порт шепота в C ++.
- Привязки для многих языков
- Whisperx - добавляет быстрое автоматическое распознавание динамиков с помощью временных метров уровня и динамика.
- быстрее - более быстрое переопределение шепота с использованием ctranslate2.
- Whisper Jax - JAX реализация Whisper для скорости до 70x на TPU.
- Whisper-Timested-добавляет временные метки на уровне слов и оценки уверенности.
- Whisper -Openvino - Whisper Running On OpenVino.
- Whisper.tflite - Whisper Running On Tensorflow Lite.
- Whisper Variants - Различные варианты шепота для обнимающих лиц.
- Whisper-at-шепот, который может распознавать неречевые аудио события в дополнение к речи.
Приложения
- AIKO - Audio Transcpring iOS и MacOS App.
- MacWhisper - Audio Transcription App MacOS. (Freemium)
- Whisper Memoros - Audio Transpring IOS приложение. (Freemium)
- Four Youyou - Audio Journal IOS App.
- Jojo Transcribe - Audio Transcription Macos App.
- Buzz - Аудио транскрипция и перевод MacOS App.
- Whisperscript - Audio Transcption MacOS App. (Freemium · Electron)
- Audio Podium - Audio/Video Management App Macos.
- Superwhisper - Глобальная аудио транскрипция MacOS Bar Bar.
- Речевая примечание - Audio Transcription Linux App.
- Пятница - диктовка MacOS App Powered By OpenAI API.
- EasyWhisper - приложение Windows и MacOS для аудио транскрипции и динамики динамика. (Freemium)
Веб -приложения
Размещен
- Bigwav - Аудио транскрипция и инструмент аннотации.
- Бесплатная транскрипция подкаста - работает локально в вашем браузере.
- ГЛАДИЯ - Транскрипция с обработкой в реальном времени.
Самостоятельно
- Subs AI - генерация субтитров.
- Ваас - GUI и API для шепота.
- writeout.ai - приложение Laravel для транскрибирования и перевода аудиофайлов.
- Meeper - стенограммы, резюме и многое другое для встреч и любых вкладки браузера. (Приложение Chrome)
CLI Инструменты
- yt -whisper - генерация субтитров YouTube.
- Phonix - генерировать подписи для видео.
- Шепот-стандалон-победитель-автономные окна, исполняемые для шепота и более быстрого шепота.
- Whisper-Ctranslate2-инструмент командной строки Whisper на основе CTRANSLATE2, совместимый с оригиналом.
- Безумительно-фаст-клик-достичь скорости транскрипции около 30x в режиме реального времени с несколькими оптимизациями.
- Диаризация шепота - автоматическое распознавание речи с дневником динамика.
Детские площадки
- Обнимающиеся лица - прошептаная демонстрация, бегая на обнимающих лицах. (Источник)
- Monster API - Demo, пробегая на монстра, API. (Источник)
- Web Whisper - Whisper Demo от Pluja. (Источник)
- YouTube видео транскрипция - работа на Colab.
Пакеты
JavaScript
- Использование - реагировать крюк.
Статьи
- Шепот модульного будущего ИИ-будущее машинного обучения лежит в адаптируемых и доступных программах переноса речи с открытым исходным кодом.
- Как запустить модель распознавания речи Whisper - объясняет, как установить и запустить модель, а также обеспечить анализ производительности, сравнивая шепот с другими моделями.
- Создайте свое собственное приложение для речи для текста, используя Flask-Учебное пособие демонстрирует модель Shepper's Speech-Text, с демонстрацией ее запуска в тетради по градиенту и руководством для настройки приложения Flask с градиентным развертыванием.
- Преобразовать подкасты в текст-Учебное пособие по API Whisper с Python для транскрипции речи к тексту, демонстрируя более быструю транскрипцию GPU и передовые технологии.
Видео
- Открыть шепот ИИ потрясающий! - Введение в шепот.
- Как сделать транскрипцию свободы к тексту лучше, чем Google Premium API-Учебное пособие.
- Многоязычное приложение для распознавания речи ИИ - Учебное пособие.
Сообщество
Сторонние API
API, которые используют Whisper.
- Whisper+ - Расширение модели Whisper, которая добавляет мощные функции, такие как идентификация динамиков, пользовательский словарь, суммирование и генерация главы.
- Replicate - Используйте Whisper Running на Replicate.
Связанные списки
- Awesome -Chatgpt - ресурсы Chatgpt.