Whisper es un sistema de reconocimiento de voz de código abierto desarrollado por OpenAI
Contenido
- Oficial
- Variantes de modelo
- Aplicaciones
- Aplicaciones web
- Herramientas de CLI
- Parques infantiles
- Paquetes
- Artículos
- Videos
- Comunidad
- API de terceros
- Listas relacionadas
Oficial
- Introducción
- Código fuente
- Papel blanco
Variantes de modelo
- Whisper.cpp - Puerto de Whisper en C ++.
- Bindings para muchos idiomas
- Whisperx: agrega reconocimiento de altavoces automático rápido con marcas de tiempo a nivel de palabra y diarización de altavoces.
- más rápido: una reimplementación más rápida de Whisper usando Ctranslate2.
- Whisper Jax - Implementación de Jax de Whisper por hasta 70 veces aceleración en TPU.
- Whisper-Timestamped: agrega marcas de tiempo a nivel de palabra y puntajes de confianza.
- Whisper -Openvino - Whisper corriendo en Openvino.
- Whisper.tflite - Whisper corriendo en Tensorflow Lite.
- Variantes de susurro: varias variantes de susurro en caras abrazadas.
- Whisper-AT-Whisper que puede reconocer eventos de audio sin voz además del habla.
Aplicaciones
- AIKO - Audio Transcripción IOS y la aplicación MacOS.
- MacWhisper - Audio Transcripción MacOS Aplicación. (Freemium)
- Whisper Memas - Audio Transcripción Aplicación iOS. (Freemium)
- FourYou - Audio Journal iOS App.
- JoJo Transcribe - Audio Transcripción MacOS Aplicación.
- Buzz - Audio Transcripción y Traducción Aplicación MacOS.
- Whisperscript - Aplicación de MacOS de transcripción de audio. (Freemium · Electron)
- Audio Podium - Aplicación MacOS de gestión de audio/video.
- Superwhisper - Aplicación global de la barra de menú MacOS de transcripción de audio.
- Nota del habla: aplicación de transcripción de audio Linux.
- FridayGPT - Aplicación MacOS Dictation alimentada por OpenAI API.
- Easywhisper - Aplicación Windows y MacOS para transcripción de audio y diarización de altavoces. (Freemium)
Aplicaciones web
Alojado
- BigWav - Herramienta de transcripción y anotación de audio.
- Transcripción de podcast gratuito: se ejecuta localmente en su navegador.
- Gladia - Transcripción con procesamiento en tiempo real.
Autohospedado
- Subs ai - Generación de subtítulos.
- Waas - GUI y API para susurros.
- Writeut.AI - Laravel App para transcribir y traducir archivos de audio.
- Meeper: transcripciones, resumen y más para reuniones y cualquier pestaña del navegador. (Aplicación Chrome)
Herramientas de CLI
- YT -Whisper - Generación de subtítulos de YouTube.
- Phonix: genere subtítulos para videos.
- Whisper-Standalone-Win-Ejecutable de ventanas independientes para Whisper y Whisper más rápido.
- Whisper-Ctranslate2-Herramienta de línea de comandos Whisper basada en Ctranslate2, compatible con el original.
- Insanely rápido-Whisper-Cli: alcance las velocidades de transcripción cerca de 30x en tiempo real con varias optimizaciones.
- Diarización de susurros - Reconocimiento automático de voz con diarización de altavoces.
Parques infantiles
- Abrazando caras - Demo de susurros corriendo en caras abrazadas. (Fuente)
- Monster API - Demo de Whisper que se ejecuta en Monster API. (Fuente)
- Web Whisper - Whisper Demo de Pluja. (Fuente)
- Transcripción de video de YouTube: ejecutándose en Colab.
Paquetes
Javascript
- Use -Whisper - React Hook.
Artículos
- Susurros del futuro modular de la IA: el futuro del aprendizaje automático se encuentra en programas de transcripción de voz abierta adaptables y accesibles.
- Cómo ejecutar el modelo de reconocimiento de voz Whisper: explica cómo instalar y ejecutar el modelo, así como proporcionar un análisis de rendimiento que compare Whisper con otros modelos.
- Cree su propia aplicación de discurso para Text usando Flask: el tutorial demuestra el modelo de voz a texto de Whisper, con una demostración sobre la ejecución en un cuaderno de gradiente y una guía para configurar una aplicación Flask con implementaciones de gradiente.
- Convertir podcasts a texto: tutorial sobre la API Whisper con Python para la transcripción de voz a texto, mostrando la transcripción más rápida de GPU y la tecnología avanzada.
Videos
- ¡Open AI's Whisper es increíble! - Introducción al susurro.
- Cómo hacer una transcripción de expresión de voz a texto mejor que Google Premium API-Tutorial.
- APLICACIÓN DE DISCURA AI MULTILINGUAL APPLACIÓN - TUTORIAL.
Comunidad
API de terceros
API que usan susurro.
- Whisper+ - Extensión del modelo Whisper que agrega características potentes como el vocabulario personalizado de identificación del altavoz, resumen y generación de capítulos.
- Replicar: use Whisper Running en Replicate.
Listas relacionadas
- Awesome -Chatgpt - Recursos de chatgpt.