Whisperは、Openaiによって開発されたオープンソースAI駆動の音声認識システムです
コンテンツ
- 正式
- モデルバリアント
- アプリ
- Webアプリ
- CLIツール
- 遊び場
- パッケージ
- 記事
- ビデオ
- コミュニティ
- サードパーティAPI
- 関連リスト
正式
モデルバリアント
- whisper.cpp- c ++のささやきポート。
- Whisperx-ワードレベルのタイムスタンプとスピーカーのダイアリゼーションを使用して、高速自動スピーカー認識を追加します。
- より速いウィスパー - ctranslate2を使用したささやきのより速い再実装2。
- Whisper Jax -TPUで最大70倍のスピードアップでささやきのJAX実装。
- Whisper-Timestameded-ワードレベルのタイムスタンプと自信のスコアを追加します。
- Whisper -Openvino- OpenVinoで走っているささやき。
- whisper.tflite- tensorflow liteで走っているささやき。
- ウィスパーバリエーション - ハグする顔にさまざまなささやき変異体。
- Whisper-AT-スピーチに加えて非スピーチオーディオイベントを認識できるささやき。
アプリ
- Aiko-オーディオ転写iOSおよびMacOSアプリ。
- MacWhisper -Audio Transcription MacOSアプリ。 (フリーミアム)
- Whisper Memos -Audio Transcription iOS App。 (フリーミアム)
- FORYOU -Audio Journal iOSアプリ。
- Jojo Transcribe -Audio Transcription MacOSアプリ。
- バズ - オーディオ転写と翻訳macOSアプリ。
- WhisperScript -Audio Transcription MacOSアプリ。 (フリーミアム・電子)
- Audio Podium -Audio/Video Management MacOSアプリ。
- SuperWhisper -Global Audio Transcription MacOSメニューバーアプリ。
- スピーチノート - オーディオ転写Linuxアプリ。
- FriedGpt -Openai APIを搭載したDictation MacOSアプリ。
- EasyWhisper-オーディオ転写とスピーカーのダイアリゼーション用のWindowsおよびMacOSアプリ。 (フリーミアム)
Webアプリ
ホスト
- BigWav-オーディオ転写と注釈ツール。
- 無料のポッドキャスト転写 - ブラウザでローカルに実行されます。
- Gladia-リアルタイム処理による転写。
自己ホスト
- Subs ai-サブタイトル生成。
- WAAS -GUIとささやきのAPI。
- writeout.ai-オーディオファイルを転写および翻訳するLaravelアプリ。
- Meeper-会議やブラウザタブの転写、概要など。 (Chromeアプリ)
CLIツール
- YT -Whisper -YouTubeサブタイトル生成。
- フォニックス - ビデオのキャプションを生成します。
- Whisper-Standalone-Win-Standalone Windows実行可能なWhisperとより速いささやきのための実行可能。
- whisper-ctranslate2-オリジナルと互換性のあるCtranslate2に基づくWhisperコマンドラインツール。
- 非常に速いウィスパー-Cli-いくつかの最適化で30倍のリアルタイム近くに転写速度を達成します。
- ささやき方向性 - スピーカーダイアリゼーションによる自動音声認識。
遊び場
- 抱きしめる顔 - 抱きしめる顔で実行されているささやきデモ。 (ソース)
- Monster API -Monster APIで実行されているささやきデモ。 (ソース)
- Web Whisper -PlujaによるWhisper Demo。 (ソース)
- YouTubeビデオ転写 - colabで実行されます。
パッケージ
JavaScript
記事
- AIのモジュールの未来のささやき - 機械学習の未来は、適応可能でアクセス可能なオープンソースの音声転写プログラムにあります。
- ささやき声認識モデルの実行方法 - モデルのインストールと実行方法を説明し、ささやきと他のモデルを比較したパフォーマンス分析を提供します。
- Flaskを使用してテキストアプリをテキストに作成する独自のスピーチを作成します - チュートリアルでは、Whisperのスピーチツーテキストモデルを示しています。グラデーションノートブックで実行するデモと、Gradient Deploymentsを備えたFlaskアプリをセットアップするためのガイドを示しています。
- ポッドキャストをテキストに変換します - ウィスパーAPIのチュートリアルは、音声からテキストの転写、GPUのより速い転写、高度な技術を紹介するためにPythonを使用します。
ビデオ
- オープンAIのささやきは素晴らしいです! - ささやきの紹介。
- Google Premium API-Tutorialよりも優れた言論からテキストへの転写を行う方法。
- 多言語AI音声認識ライブアプリ - チュートリアル。
コミュニティ
サードパーティAPI
ささやきを使用するAPI。
- whisper+ - スピーカー識別カスタム語彙、要約、章生成などの強力な機能を追加するウィスパーモデルの拡張。
- 複製 - レプリケートで実行されているささやきを使用します。
関連リスト
- Awesome -chatgpt -chatgptリソース。