Это Unity3D -привязки для Whisper.cpp. Он обеспечивает высокопроизводительный вывод модели автоматического распознавания шепота Openai (ASR), работающей на вашей местной машине.
Этот репозиторий поставляется с весами модели "ggml-tiny.bin". Это самая маленькая и быстрая версия модели Whisper, но она имеет худшее качество по сравнению с другими моделями. Если вы хотите лучшего качества, проверьте веса других моделей.
Основные особенности:
Поддерживаемые платформы:
«Whisper-Small.bin» модель тестируется на английском, немецком и русском языке от микрофона
Модель "Whisper-round.bin", в 50 раз быстрее, чем в режиме реального времени на MacBook с M1 Pro
Клонировать этот репозиторий и откройте его как обычный проект Unity. Он поставляется с примерами и крошечными весами с многолушней.
В качестве альтернативы вы можете добавить этот репозиторий в свой проект в качестве пакета Unity . Добавьте его по этому jit URL в свой менеджер пакетов Unity:
https://github.com/Macoron/whisper.unity.git?path=/Packages/com.whisper.unity
Проект Unity, составленный с включенным CUDA, ожидает, что ваши конечные пользователи будут иметь библиотеки NVIDIA и библиотеки CUDA. Попытка запустить сборку без этого приведет к ошибке.
Для выполнения вывода с помощью CUDA вам нужно будет поддерживать графический процессор и установить инструментарий CUDA (протестированный с 12.2.0).
После этого перейдите в настройки проекта => Whisper => включить CUDA . Это должно заставить пакет использовать библиотеку, скомпилированную для CUDA.
Whisper.cpp поддерживает металл только в семействе или более новех и более новых графических процессорах Apple7 (начиная с чипсов Apple M1). Попытка запустить на старом оборудовании будет отступить к выводу процессора.
Чтобы активировать металлический вывод, перейдите к настройкам проекта => Whisper => Enable Metal . Это должно заставить пакет использовать библиотеку, скомпилированную для металла.
Вы можете попробовать разные веса Whisper Model. Например, вы можете улучшить транскрипцию английского языка, используя веса только для английского языка или попробовав более крупные модели.
Вы можете скачать веса модели отсюда. Просто поместите их в папку StreamingAssets .
Для получения дополнительной информации о различиях и форматах моделей прочитайте Whisper.cpp readme и Openai Readme.
Этот проект поставляется с библиотеками Whisper.cpp Prebuild для всех поддерживаемых платформ. Вы можете восстановить их из источника, используя действия GitHub. Чтобы сделать это, создать вилку этого репо и перейти в Actions => Build C++ => Run workflow . После завершения трубопровода загрузите скомпилированные библиотеки в вкладке Artifacts.
Если вы хотите создать библиотеки на своей машине:
. b uild_cpp.bat cpu path t o w hispersh build_cpp.sh path/to/whisper all path/to/ndk/android.toolchain.cmakesh build_cpp_linux.sh path/to/whisper cpuPlugins пакета.Windows будет создавать только библиотеку Windows, Linux будет производить только Linux. MacOS будет производить библиотеки MacOS, iOS и Android.
Скрипт MacOS Build был протестирован на Mac с процессором ARM. Для процессоров Intel вам может потребоваться изменить некоторые параметры.
Этот проект лицензирован по лицензии MIT.
Он использует скомпилированные библиотеки и модель веса Whisper.cpp, которая находится под лицензией MIT.
Оригинальный код шепота Openai и веса также находятся под лицензией MIT.