Download whispering ui - download do código -fonte da interface whispering ui

whispering ui

Código-Fonte de IA

v1.3.3.1

Baixar

Ui de tigre sussurro (tradução/transcrição ao vivo)

A interface do usuário do Tiger Susspering é uma UI nativa que pode ser usada para controlar a aplicação sussurrada do tigre .

O Whispering Tiger é uma ferramenta gratuita e de código aberto que pode ouvir/assistir a qualquer fluxo de áudio ou imagem do jogo em sua máquina e imprime a transcrição ou tradução para um navegador da Web usando WebSockets ou Over OSC (os exemplos são de streaming-sulaias ou VRCHAT ).

Guia Spean-Toxt

Contente

Características
Download
Tutoriais
Instalação
Configurar
- Configuração dos plugins
- Exemplo de configuração do plug -in VoiceVox (TTS japonês)
- Configuração de áudio específica (TTS para MIC, Tradução de áudio de jogo, etc.)
- Configuração em tempo real e melhorias de velocidade
Recursos avançados
Ajuda adicional (discórdia)
Capturas de tela

Características

Nativo-UI para Windows (e possivelmente Linux no futuro)
Fácil de usar para iniciantes e usuários avançados
Acesso a todos os recursos do Tiger sussurrando , que incluem:
- Transcrição / tradução de fluxos de áudio
- Tradução de textos
- Texto para fala
- Reconhecimento e tradução de imagens no jogo
- Exibindo os resultados em um navegador da web ou vrchat, usando websockets ou OSC
Suporte ao dispositivo de áudio Loopback para capturar o PC Audio sem ferramentas adicionais
Salvar e carregar configurações
Visualizar se seus dispositivos de áudio selecionados estão funcionando
Suporte ao plug -in para recursos adicionais (encontre uma lista de plugins aqui)
- Plugin de legendas em tempo real
- Muitos plugins text2speech
- Plugin de previsão de emoção
- Atualmente tocando plugin de música
- Plug -in de exportação de legenda
- Plugin de conversão de voz baseado em recuperação (RVC)
- Grandes modelos de idiomas plugin
- E mais ...
Atualização automática para a versão mais recente do sussurro Tiger .

Download

Faça o download da versão mais recente da página de lançamentos.

Guia Spean-Toxt

Tutoriais

Tutorial em vídeo " Whispering Tiger - Tradução e transcrição ao vivo ":

Instalação

Depois de baixar a versão mais recente dos [ lançamentos ], extrai -a para uma pasta de sua escolha em uma unidade com espaço livre suficiente.
(Não o execute diretamente do arquivo zip, não funcione da unidade externa.)
Instale o CUDA para aceleração da GPU (opcional, mas recomendado para GPUs NVIDIA).
Execute o arquivo sussurro Tiger.exe .
Deixe o download da versão mais recente do Whispering Tiger . (Ele pedirá para baixar a plataforma.)
Após o término do download, você pode criar um perfil e começar a usar o aplicativo sussurro do tigre .
- Na primeira partida, ele começará a baixar os modelos de IA que podem demorar um pouco, dependendo do tamanho do modelo selecionado. (Atualmente, ele não mostra o status dos downloads do modelo)

Configurar

Crie um perfil digitando um nome e clicando no botão novo .
Websocket IP + Port pode ser mantida nos valores padrão "127.0.0.1" e "5000".
- Isso só é útil se você deseja executar várias instâncias ou a plataforma de back -end é executada em um PC separado.
- Se você deseja executar várias instâncias, precisará alterar a porta para cada instância.
Selecione seus dispositivos de entrada e saída de áudio. Você pode testá -los falando no seu microfone e clicando no botão de teste.
- Você deve ver a barra de entrada de áudio se mover quando você fala. e ouça um teste de teste e veja a barra de saída de áudio mover quando você clicar no botão de teste .
- Consulte também Configuração de áudio (TTS para MIC, Tradução de áudio do jogo, etc.) para obter mais informações sobre configurações específicas de áudio.
  (Como quando você deseja traduzir o áudio de jogos, vídeos ou fluxos que são reproduzidos no seu PC em vez de usar um microfone como entrada.) .
(Opcional) Use Push to Talk Click no campo e pressione as chaves que você deseja usar para push para conversar
(Pressione cada tecla separadamente para configurar. Ao executar o perfil, todas as teclas deverão ser pressionadas ao mesmo tempo ao usar o Push to Talk)
- Para desativar o AutoDetect da fala, para usar apenas o Push to Talk, defina Speech volume Level e Speech pause detection para 0.
Fique de olho no consumo estimado de memória no canto inferior direito.
É apenas uma estimativa aproximada e pode variar, mas deve lhe dar uma idéia de quanto (V-) RAM você precisa para os modelos de IA selecionados. e opções.
Selecione o dispositivo AI para tradução de fala para texto e texto de acordo com o seu hardware.
- CUDA ( requer uma GPU NVIDIA ) ou CPU.
- O CUDA carregará a IA no V-RAM e será mais rápido que a CPU.
Selecione o tamanho da fala para texto e o tamanho da tradução de texto .
- Quanto maior o tamanho, mais preciso, mas também mais lento será a transcrição.
- Quanto maior o tamanho, mais (V-) RAM ele usará.
- Nota: O modelo de IA do tamanho e precisão selecionado será baixado automaticamente quando você iniciar o aplicativo pela primeira vez.
Selecione a precisão de precisão de fala para texto e precisão de texto
- Quanto maior a precisão, mais precisa e mais (V-) RAM é usada. ( No entanto, as diferenças de precisão são quase insignificantes ).
- As GPUs modernas têm uma aceleração melhor para float16 .
- CPU Support da CPU float32 , int16 ou int8 Precision.

Observação:
Você pode brincar com os valores até obter os resultados desejados.
Se algo não funcionar, verifique o log na guia Avançado . E verifique se há qualquer erro.
Ative o log de gravação no arquivo para salvar o log em um arquivo.

Configuração dos plugins

Instale os plugins usando a interface do usuário diretamente, ou ..
Instale os plugins manualmente.
- Selecione o plug -in desejado na lista de plugins aqui.
- Faça o download do arquivo *.py e coloque -o na pasta Plugins .
- Reinicie o aplicativo.
- O plug -in agora deve estar disponível na guia Plugins .

Observação:
A maioria dos plugins possui configurações específicas que podem ser configuradas nas caixas de texto do plug -in na guia Plugins .