Download de whisper.unity - whisper.unity Download do código -fonte

whisper.unity

Outro código-fonte

1.3.2

Baixar

sussurro

Esta é a unidade 3D ligações para o sussurro.cpp. Ele fornece inferência de alto desempenho do modelo de reconhecimento automático de fala Whisper (ASR) da OpenAI em execução em sua máquina local.

Este repositório vem com pesos do modelo "ggml tiny.bin". Esta é a versão menor e mais rápida do modelo Whisper, mas tem uma qualidade pior em comparação com outros modelos. Se você deseja melhor qualidade, confira outros modelos pesos.

Principais recursos:

Multilíngue, suporta cerca de 60 idiomas
Pode traduzir um idioma para outro (por exemplo, discurso alemão para o texto em inglês)
Tamanhos de modelos diferentes que oferecem troca de velocidade e precisão
É executado no dispositivo de usuários locais sem conexão com a Internet
Grátis e de código aberto, pode ser usado em projetos comerciais

Plataformas suportadas:

Amostras

multilang.mp4

Modelo "Whisper-small.bin" testado em inglês, alemão e russo do microfone

tiny.mp4

Modelo "Whisper Tiny.bin", 50x mais rápido que em tempo real no MacBook com M1 Pro

Começando

Clone este repositório e abra -o como projeto regular de unidade. Ele vem com exemplos e pequenos pesos do modelo multilanguage.

Como alternativa, você pode adicionar este repositório ao seu projeto como um pacote de unidade . Adicione -o por este URL Git ao seu gerenciador de pacotes da Unity:

 https://github.com/Macoron/whisper.unity.git?path=/Packages/com.whisper.unity

Suporte CUDA

O Unity Project compilado com a CUDA habilitada espera que seus usuários finais tenham bibliotecas Nvidia GPU e CUDA. Tentar executar o Build sem ele resultará em erro.

Para executar a inferência no CUDA, você precisaria ter suportado a GPU e instalado o CUDA Toolkit (testado com 12.2.0).

Depois disso, vá para as configurações do projeto => sussurro => Ativar CUDA . Isso deve forçar o pacote a usar a biblioteca compilada para CUDA.

Suporte de metal

Whisper.cpp suporta metal apenas na família Apple7 GPUs ou mais recente (começando pela Apple M1 Chips). Tentar correr com hardware mais antigo fará o fallback da inferência da CPU.

Para ativar a inferência de metal, vá para as configurações do projeto => sussurro => Ativar metal . Isso deve forçar o pacote a usar a biblioteca compilada para metal.

Baixando outros pesos do modelo

Você pode tentar diferentes pesos do modelo de sussurro. Por exemplo, você pode melhorar a transcrição do idioma inglês usando pesos somente em inglês ou tentando modelos maiores.

Você pode baixar os pesos do modelo aqui. Basta colocá -los na pasta StreamingAssets .

Para obter mais informações sobre as diferenças e formatos de modelos, leia o sussurro.cpp readme e o OpenAI ReadMe.

Compilando bibliotecas C ++ da fonte

Este projeto vem com bibliotecas pré -construtivas do sussurro.cpp para todas as plataformas suportadas. Você pode reconstruí -los da fonte usando ações do GitHub. Para fazer isso, faça o garfo deste repositório e entre em Actions => Build C++ => Run workflow . Após a conclusão do pipeline, faça o download das bibliotecas compiladas na guia Artefatos.

Caso você queira construir bibliotecas em sua máquina:

Clone o repositório original do Whisper.cpp
Tag de checkout v1.5.5. Outras versões podem não funcionar com essas ligações de unidade.
Pasta Open Whisper.Unity com linha de comando
Se você estiver usando o Windows Write:

. b uild_cpp.bat cpu path t o w hisper

Se você estiver usando o MacOS , escreva:

sh build_cpp.sh path/to/whisper all path/to/ndk/android.toolchain.cmake

Se você estiver usando o Linux Write

sh build_cpp_linux.sh path/to/whisper cpu

Se a Build foi bem -sucedida bibliotecas compiladas deve ser automaticamente atualizar a pasta de Plugins de pacotes.

O Windows produzirá apenas a biblioteca do Windows, o Linux produzirá apenas o Linux. MacOS produzirá bibliotecas MacOS, iOS e Android.

O script de construção do MACOS foi testado no Mac com o processador ARM. Para processadores Intel, você pode precisar alterar alguns parâmetros.

Licença

Este projeto está licenciado sob a licença do MIT.

Ele usa bibliotecas compiladas e o modelo pesa de sussurro.cpp, que está sob licença do MIT.

O código e os pesos do OpenAi Whisper originais também estão sob licença do MIT.

Expandir

Informações adicionais

Versão 1.3.2
Tipo Outro código-fonte
Data da Última Atualização 2025-03-05
tamanho 88.56MB
Vindo de Github

Aplicativos Relacionados

SenseGlove Unity

2024-11-10
unity setup

2024-11-08
get unity

2024-11-04
Versão completa do Naughty Pig Xinchhuang Unity

2023-05-25
Naughty Pig Nova versão do Unity para Android

2022-11-30
Unidade de Comando II

2022-08-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos