Whisper ist ein Open-Source-KI-angetanter Spracherkennungssystem, der von OpenAI entwickelt wurde
Inhalt
- Offiziell
- Modellvarianten
- Apps
- Web -Apps
- CLI -Werkzeuge
- Spielplätze
- Pakete
- Artikel
- Videos
- Gemeinschaft
- APIs von Drittanbietern
- Verwandte Listen
Offiziell
- Einführung
- Quellcode
- Weißes Papier
Modellvarianten
- Flüster.cpp - Port of Whisper in C ++.
- Bindungen für viele Sprachen
- Whisperx - Fügt eine schnelle automatische Sprecherkennung mit Zeitstempel und Sprecherdurch Diatisierung hinzu.
- schneller -whisper - schnellere Neuimplementierung von Flüster mit ctranslate2.
- Whisper Jax - JAX -Implementierung von Whisper für bis zu 70 -fache Beschleunigung bei TPU.
- flüstertimiert-fügt Zeitstempel und Vertrauenswerte auf Wortebene hinzu.
- flüsterepenvino - flüstere auf openvino.
- flüster.tflite - flüsterung auf Tensorflow lite.
- Flüstervarianten - Verschiedene Flüstervarianten auf umarmenden Gesichtern.
- Whisper-at-Whisper, das neben der Sprache nicht sprachliche Audioereignisse erkennen kann.
Apps
- AIKO - Audio -Transkription iOS und macOS -App.
- MacWhisper - Audio -Transkription macOS -App. (Freemium)
- Whisper Memos - Audio Transkription iOS App. (Freemium)
- Fouryou - Audio Journal iOS App.
- Jojo Transcribe - Audio Transcription MacOS App.
- Buzz - Audio -Transkription und Übersetzung macOS -App.
- Whisperscript - Audio -Transkription macOS -App. (Freemium · Elektron)
- Audio -Podium - Audio/Video Management MacOS App.
- Superwhisper - Globale Audio -Transkriptions -MacOS -Menüleiste.
- Sprachnote - Audio Transcription Linux App.
- FridayGPT - Diktat MacOS App mit OpenAI -API angetrieben.
- Easywhisper - Windows und MacOS -App für Audio -Transkription und Lautsprecherdiarisierung. (Freemium)
Web -Apps
Gehostet
- Bigwav - Audio -Transkriptions- und Annotationstool.
- Kostenlose Podcast -Transkription - Läuft lokal in Ihrem Browser.
- Gladia - Transkription mit Echtzeitverarbeitung.
Selbst veranstaltet
- Subs ai - Untertitelgenerierung.
- WAAS - GUI und API für Whisper.
- Schreiben.ai - Laravel -App, um Audiodateien zu transkribieren und zu übersetzen.
- Meeper - Transkriptionen, Zusammenfassung und mehr für Besprechungen und die Registerkarte Browser. (Chrome App)
CLI -Werkzeuge
- Yt -Whisper - YouTube -Untertitel -Erzeugung.
- Phonix - Bildunterschriften für Videos generieren.
- Whisper-Standalone-Win-Standalone-Fenster ausführbar für Flüstern und schnelleres Flüstern.
- Whisper-CRANSLATE2-Whisper-Befehlszeilen-Tool basierend auf ctranslate2, kompatibel mit dem Original.
- Wahnsinnige Schnauze-Whisper-Cli-Erreichen Sie Transkriptionsgeschwindigkeiten in der Nähe von 30x Echtzeit mit mehreren Optimierungen.
- Whisper -Diarization - Automatische Spracherkennung mit Sprecherdurch Diatrisierung.
Spielplätze
- Umarmende Gesichter - flüstere Demo, die auf umarmenden Gesichtern rennt. (Quelle)
- Monster API - Whisper Demo auf Monster -API. (Quelle)
- Web Whisper - Whisper Demo von Pluja. (Quelle)
- YouTube -Video -Transkription - Laufen auf Colab.
Pakete
JavaScript
- Nutzungswhisper - React Hook.
Artikel
- Flüstern der modularen Zukunft von AI-Die Zukunft des maschinellen Lernens liegt in anpassungsfähigen und zugänglichen Open-Source-Sprachtranskriptionsprogrammen.
- So führen Sie das Whisper -Spracherkennungsmodell aus - Erklärt, wie das Modell installiert und ausgeführt wird sowie eine Leistungsanalyse bereitstellt, in der Flüster mit anderen Modellen verglichen wird.
- Erstellen Sie mit Flask Ihre eigene Sprache zu Text-App-Das Tutorial zeigt das Sprach-zu-Text-Modell von Whisper, mit einer Demo zum Ausführen in einem Gradienten-Notizbuch und einer Anleitung zum Einrichten einer Flask-App mit Gradientenbereitstellungen.
- Konvertieren Sie Podcasts in Text-Tutorial auf der Whisper-API mit Python für Sprach-Text-Transkription und präsentieren die schnellere Transkription und die fortschrittliche Technologie der GPU.
Videos
- Open Ai's Whisper ist unglaublich! - Einführung in Whisper.
- So führt die Transkription mit Redesprach-Text-Transkription besser als Google Premium-API-Tutorial.
- Mehrsprachige KI -Spracherkennung Live -App - Tutorial.
Gemeinschaft
APIs von Drittanbietern
APIs, die Whisper verwenden.
- Whisper+ - Erweiterung des Flüstermodells, das leistungsstarke Funktionen wie Lautsprecher -Identifikationen benutzerdefinierter Wortschatz, Zusammenfassung und Kapitelgenerierung hinzufügt.
- Replikat - Verwenden Sie das Replikat mit Flüsterung.
Verwandte Listen
- Awesome -Chatgpt - Chatgpt -Ressourcen.