Whisper é um sistema de reconhecimento de fala de IA de código aberto desenvolvido pelo OpenAI
Conteúdo
- Oficial
- Variantes de modelo
- Aplicativos
- Aplicativos da web
- Ferramentas da CLI
- Playgrounds
- Pacotes
- Artigos
- Vídeos
- Comunidade
- APIs de terceiros
- Listas relacionadas
Oficial
- Introdução
- Código -fonte
- Papel branco
Variantes de modelo
- Sussurro.cpp - Porta do sussurro em c ++.
- Ligações para muitos idiomas
- Whisperx - adiciona um rápido reconhecimento automático de alto -falantes com registro de data e hora no nível da palavra e diarização do alto -falante.
- mais rápido - mais rápido - reimplementação mais rápida do sussurro usando ctranslate2.
- Whisper Jax - Implementação Jax do Whisper para até 70x Speed -Up na TPU.
- Whisper-Timestamped-adiciona registro de data e hora no nível da palavra e pontuações de confiança.
- Whisper -Openvino - Whisper Running on Openvino.
- Whisper.tflite - Whisper Running on Tensorflow Lite.
- Variantes de sussurros - várias variantes de sussurros em abraços de abraços.
- Whisper-AT - Whisper that can recognize non-speech audio events in addition to speech.
Aplicativos
- AIKO - APP APP IOS e MACOS DA TRANSCRIÇÃO DE ÁUDIO.
- MACWHISPER - APP APP APP. (Freemium)
- MEMOS SHEINTES - APP APP APPION IOS. (Freemium)
- Quatro Voo - App App App App.
- JOJO Transcribe - App App App Audio Transcription.
- Buzz - Transcrição de áudio e tradução MacOS App.
- Whisperscript - App de transcrição de áudio. (Freemium · elétron)
- Pódio de áudio - MacOS de gerenciamento de áudio/vídeo App.
- SUPERWHISPER - APP GLOBAL DE MENU MENU MENU MACOS DA TRANSCRIÇÃO DE AUDIO.
- Nota de fala - aplicativo Linux de transcrição de áudio.
- FRESTAGPT - DITATION MACOS APP APIA DE API OPENAI.
- EasyWhisper - aplicativo Windows e MacOS para transcrição de áudio e diarização do alto -falante. (Freemium)
Aplicativos da web
Hospedado
- BigWav - Ferramenta de transcrição de áudio e anotação.
- Transcrição gratuita do podcast - é executado localmente no seu navegador.
- Gladia - Transcrição com processamento em tempo real.
Self-hosted
- Subs ai - geração de legenda.
- WAAS - GUI e API para sussurrar.
- writeout.ai - Laravel App para transcrever e traduzir arquivos de áudio.
- MEEPER - Transcrições, resumo e muito mais para reuniões e qualquer guia do navegador. (Chrome App)
Ferramentas da CLI
- YT -Whisper - Geração de legenda do YouTube.
- PHONIX - Gere legendas para vídeos.
- Whisper-Standalone-Win-Windows independente independente para Whisper e Whisper mais rápido.
- Whisper-CTRANSLATE2-Ferramenta de linha de comando sussurro com base no CTRANSLATE2, compatível com o original.
- Cli-cli insanamente rápido-atinge velocidades de transcrição perto de 30x em tempo real com várias otimizações.
- Whisper -Diarization - Reconhecimento automático de fala com diarização do alto -falante.
Playgrounds
- Abraçando rostos - demonstração de sussurros correndo em rostos abraçados. (Fonte)
- MONSTER API - Demonstração de sussurro em execução na API Monster. (Fonte)
- Web Whisper - Demonstração de Whisper de Pluja. (Fonte)
- Transcrição de vídeo do YouTube - executando no COLAB.
Pacotes
JavaScript
- use -whisper - gancho do react.
Artigos
- Sussurros do futuro modular da IA-o futuro do aprendizado de máquina está em programas de transcrição de fala de código aberto adaptável e acessível.
- Como executar o modelo de reconhecimento de fala Whisper - explica como instalar e executar o modelo, além de fornecer uma análise de desempenho comparando Whisper a outros modelos.
- Crie seu próprio aplicativo de discurso para texto usando o Flask-o tutorial demonstra o modelo de fala para texto do Whisper, com uma demonstração para executá-lo em um notebook de gradiente e um guia para configurar um aplicativo de frasco com implantações de gradiente.
- Converta os podcasts em texto-tutorial sobre a API Whisper com Python para transcrição de fala para texto, mostrando a transcrição mais rápida da GPU e a tecnologia avançada.
Vídeos
- O sussurro aberto da IA é incrível! - Introdução ao sussurro.
- Como fazer a transcrição de liberdade de expressão para texto melhor do que o Google Premium-tutorial.
- App de reconhecimento multilíngue de fala da IA - tutorial.
Comunidade
APIs de terceiros
APIs que usam sussurro.
- Whisper+ - Extensão do modelo Whisper, que adiciona recursos poderosos, como identificação de alto -falantes, vocabulário personalizado, resumo e geração de capítulos.
- Replicar - Use Whisper em execução na replicação.
Listas relacionadas
- Awesome -Chatgpt - Recursos de chatgpt.