Descarga de whisper.unity - Descargar el código fuente de whisper.unity

whisper.unity

Otro código fuente

1.3.2

Descargar

susurros.

Esto es unit3d Bindings para Whisper.cpp. Proporciona una inferencia de alto rendimiento del modelo de reconocimiento automático de voz (ASR) de Openai's Whisper que se ejecuta en su máquina local.

Este repositorio viene con pesos del modelo "GGML-Tiny.Bin". Esta es la versión más pequeña y más rápida de Whisper Model, pero tiene una calidad peor en comparación con otros modelos. Si desea una mejor calidad, consulte los pesos de otros modelos.

Características principales:

Multilingüe, admite alrededor de 60 idiomas
Puede traducir un idioma a otro (por ejemplo, el discurso alemán al texto en inglés)
Diferentes tamaños de modelos que ofrecen velocidad y compensaciones de precisión
Se ejecuta en el dispositivo de usuarios locales sin conexión a Internet
Código libre y abierto, se puede utilizar en proyectos comerciales

Plataformas compatibles:

Muestras

multilang.mp4

modelo "whisper-small.bin" probado en inglés, alemán y ruso a partir de micrófono

Tiny.mp4

Modelo "Whisper-Tiny.bin", 50x más rápido que el tiempo real en MacBook con M1 Pro

Empezando

Clone este repositorio y ábralo como proyecto de unidad regular. Viene con ejemplos y pequeños pesos de modelos multilenguajos.

Alternativamente, puede agregar este repositorio a su proyecto como un paquete de unidad . Agrégalo por esta URL Git a su administrador de paquetes de Unity:

 https://github.com/Macoron/whisper.unity.git?path=/Packages/com.whisper.unity

Soporte CUDA

Unity Project compilado con CUDA habilitado espera que sus usuarios finales tengan bibliotecas NVIDIA GPU y CUDA. Intentar ejecutar la compilación sin ella dará como resultado un error.

Para ejecutar una inferencia con CUDA, necesitaría haber admitido GPU e instalado CUDA Toolkit (probado con 12.2.0).

Después de eso, vaya a la configuración del proyecto => Whisper => Habilitar CUDA . Esto debería obligar al paquete a usar la biblioteca compilada para CUDA.

Soporte de metal

Whisper.cpp admite metal solo en la familia Apple7 GPUS o más nuevo (a partir de los chips de Apple M1). Intentar ejecutar en hardware más antiguo se retirará a la inferencia de la CPU.

Para activar la inferencia de metal, vaya a la configuración del proyecto => whisper => habilitar metal . Esto debería obligar al paquete a usar la biblioteca compilada para metal.

Descargar otros pesos de modelo

Puedes probar diferentes pesos de modelos de susurro. Por ejemplo, puede mejorar la transcripción del idioma inglés utilizando pesas solo en inglés o probando modelos más grandes.

Puede descargar pesos de modelos desde aquí. Simplemente colóquelos en su carpeta StreamingAssets .

Para obtener más información sobre las diferencias y formatos de modelos, lea Whisper.cpp Readme y OpenAi Readme.

Compilación de bibliotecas de C ++ desde la fuente

Este proyecto viene con bibliotecas previas a la construcción de Whisper.cpp para todas las plataformas compatibles. Puede reconstruirlos de la fuente utilizando acciones de GitHub. Para hacer eso, haga el choque de este repositorio y ingrese a Actions => Build C++ => Run workflow . Después de completarse la tubería, descargue las bibliotecas compiladas en la pestaña Artifacts.

En caso de que desee construir bibliotecas en su máquina:

Clon el repositorio original Whisper.cpp
Etiqueta de verificación V1.5.5. Es posible que otras versiones no funcionen con estos enlaces de unidad.
Abra Whisper.unity Carper con línea de comandos
Si está utilizando Windows Write:

. b uild_cpp.bat cpu path t o w hisper

Si está usando MacOS Write:

sh build_cpp.sh path/to/whisper all path/to/ndk/android.toolchain.cmake

Si estás usando Linux Write

sh build_cpp_linux.sh path/to/whisper cpu

Si la compilación fue exitosa, las bibliotecas compiladas deben actualizarse automáticamente la carpeta Plugins de paquetes.

Windows producirá solo la biblioteca de Windows, Linux solo producirá Linux. MacOS producirá bibliotecas MacOS, iOS y Android.

MACOS Build Script se probó en Mac con el procesador ARM. Para los procesadores Intel, es posible que necesite cambiar algunos parámetros.

Licencia

Este proyecto tiene licencia bajo la licencia MIT.

Utiliza bibliotecas compiladas y pesos de modelo de whisper.cpp, que está bajo la licencia MIT.

El código y los pesos originales de Operai también están bajo la licencia MIT.

Expandir

Información adicional

Versión 1.3.2
Tipo Otro código fuente
Fecha de actualización 2025-03-05
tamaño 88.56MB
Proviene de Github

Aplicaciones relacionadas

SenseGlove Unity

2024-11-10
unity setup

2024-11-08
get unity

2024-11-04
Naughty Pig Xinchuang Unity versión completa

2023-05-25
Naughty Pig Nueva versión de Unity para Android

2022-11-30
Unidad de mando II

2022-08-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo