Whisper est un système de reconnaissance vocale open source AI développé par OpenAI
Contenu
- Officiel
- Variantes du modèle
- Applications
- Applications Web
- Outils CLI
- Terrains de jeux
- Packages
- Articles
- Vidéos
- Communauté
- API tierces
- Listes connexes
Officiel
- Introduction
- Code source
- Du papier blanc
Variantes du modèle
- Whisper.cpp - Port de Whisper en C ++.
- Reliures pour de nombreuses langues
- WhisperX - ajoute une reconnaissance automatique de haut-parleurs rapides avec des horodatages au niveau du mot et une diarisation du haut-parleur.
- plus rapide - réimplémentation plus rapide du chuchotement à l'aide de cTranslate2.
- Whisper Jax - Jax Implémentation de Whisper pour jusqu'à 70x accélération sur TPU.
- Whisper-timestamped - ajoute des horodatages au niveau des mots et des scores de confiance.
- Whisper-Openvino - Whisper coulant sur OpenVino.
- Whisper.tflite - Whisper fonctionnant sur TensorFlow Lite.
- Variantes de chuchotement - Diverses variantes de chuchotement sur les visages étreintes.
- Whisper-at - Whisper qui peut reconnaître les événements audio non-discours en plus de la parole.
Applications
- AIKO - AUDIO TRANSPRIPTION IOS et MACOS App.
- MacWhisper - Application MacOS de transcription audio. (Freemium)
- Memos Whisper - Application iOS de transcription audio. (Freemium)
- Fouryou - Application iOS du journal audio.
- JoJo Transcribe - Application MacOS de transcription audio.
- Buzz - Application de transcription audio et de traduction macOS.
- Whisperscript - Application MacOS de transcription audio. (Freemium · électron)
- Podium audio - Application MacOS de gestion audio / vidéo.
- Superwisper - Application de barre de menu MacOS de transcription audio globale.
- Remarque de la parole - Application Linux de transcription audio.
- Vendredigpt - Dictation MacOS App propulsée par API OpenAI.
- Application EasyWhisper - Windows et MacOS pour la transcription audio et la diarisation du haut-parleur. (Freemium)
Applications Web
Hébergé
- Bigwav - TRANSCRIPTION AUDIO ET TOL ANNOTATION.
- Transcription de podcast gratuite - s'exécute localement dans votre navigateur.
- Gladia - Transcription avec traitement en temps réel.
Auto-hébergé
- Subs Ai - Génération des sous-titres.
- Waas - GUI et API pour chuchotement.
- writeout.ai - application Laravel pour transcrire et traduire des fichiers audio.
- Meeper - Transcriptions, résumé et plus pour les réunions et tout onglet de navigateur. (Application Chrome)
Outils CLI
- Yt-Whisper - Génération de sous-titres YouTube.
- Phonix - Générer des légendes pour les vidéos.
- Whisper-standalone-win - Windows autonome exécutable pour chuchoter et chuchoter plus rapide.
- Whisper-Ctranslate2 - outil de ligne de commande Whisper basé sur Ctranslate2, compatible avec l'original.
- Intre-fast-whisper-cli - atteindre des vitesses de transcription près de 30x en temps réel avec plusieurs optimisations.
- Whisper-Diarization - Reconnaissance automatique de la parole avec diarisation du haut-parleur.
Terrains de jeux
- Étreindre les visages - Demo chuchotement coulant sur des visages étreintes. (Source)
- API Monster - Demo Whisper fonctionnant sur API Monster. (Source)
- Web Whisper - Demo Whisper par Pluja. (Source)
- Transcription vidéo YouTube - Exécution sur Colab.
Packages
Javascrip
- Utilisation-Whisper - React Hook.
Articles
- Les chuchotements de l'avenir modulaire de l'IA - L'avenir de l'apprentissage automatique réside dans les programmes adaptables et accessibles à la transcription de la parole open.
- Comment exécuter le modèle de reconnaissance de la parole Whisper - explique comment installer et exécuter le modèle, ainsi que fournir une analyse des performances comparant le chuchotement à d'autres modèles.
- Créez votre propre application Speech to SMS à l'aide de FLASK - Le tutoriel démontre le modèle Speech-to-Text de Whisper, avec une démo sur l'exécution dans un cahier de gradient et un guide pour configurer une application Flask avec des déploiements de gradient.
- Convertir les podcasts en texte - Tutoriel sur l'API Whisper avec Python pour la transcription de la parole à texte, présentant la transcription et la technologie avancée de GPU de GPU.
Vidéos
- Le murmure d'Open Ai est incroyable! - Introduction à Whisper.
- Comment faire la transcription de la liberté d'expression à texte mieux que Google Premium API - Tutoriel.
- Application en direct de reconnaissance de parole de l'IA multilingue - Tutoriel.
Communauté
API tierces
API qui utilisent un chuchotement.
- Whisper + - Extension du modèle Whisper qui ajoute des fonctionnalités puissantes telles que l'identification du haut-parleur, le vocabulaire personnalisé, le résumé et la génération de chapitres.
- Réplication - Utilisez Whisper en cours d'exécution sur Replicat.
Listes connexes
- Awesome-chatgpt - CHATGPT RESSOURCES.