sherpa onnx
v1.10.34
| 音声認識 | 音声合成 |
|---|---|
| ✔️ | ✔️ |
| 話者の識別 | 話者のダイアライゼーション | 話者の検証 |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| 音声言語の識別 | 音声のタグ付け | 音声アクティビティの検出 |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| キーワードの発見 | 句読点を追加する |
|---|---|
| ✔️ | ✔️ |
| 建築 | アンドロイド | iOS | 窓 | macOS | リナックス | ハーモニーOS |
|---|---|---|---|---|---|---|
| x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
| x86 | ✔️ | ✔️ | ||||
| 腕64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
| 腕32 | ✔️ | ✔️ | ✔️ | |||
| riscv64 | ✔️ |
| 1.C++ | 2.C | 3. パイソン | 4. JavaScript |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 5. ジャワ | 6.C# | 7. コトリン | 8.スウィフト |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 9. 行く | 10. ダーツ | 11. さび | 12. パスカル |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
Rust のサポートについては、sherpa-rs を参照してください。
WebAssembly もサポートしています。
このリポジトリは、次の関数のローカルでの実行をサポートしています。
次のプラットフォームとオペレーティング システム上で動作します。
x86_64ビット ARM、64 ビット ARM (arm64、aarch64)、RISC-V (riscv64)次の API を使用して
C#| 説明 | URL |
|---|---|
| 話者のダイアライゼーション | クリックしてください |
| 音声認識 | クリックしてください |
| ウィスパーによる音声認識 | クリックしてください |
| 音声合成 | クリックしてください |
| 字幕を生成する | クリックしてください |
| 音声のタグ付け | クリックしてください |
| Whisper による音声言語の識別 | クリックしてください |
WebAssembly を使用して構築されたスペースもあります。それらは以下にリストされています。
| 説明 | ハグフェイススペース | モデルスコープ空間 |
|---|---|---|
| silero-vad による音声アクティビティの検出 | クリックしてください | 地址 |
| Zipformer によるリアルタイム音声認識 (中国語 + 英語) | クリックしてください | 地址 |
| Paraformer によるリアルタイム音声認識 (中国語 + 英語) | クリックしてください | 地址 |
| Paraformer-large によるリアルタイム音声認識 (中国語 + 英語 + 広東語) | クリックしてください | 地址 |
| リアルタイム音声認識 (英語) | クリックしてください | 地址 |
| VAD + SenseVoice による音声認識 (中国語 + 英語 + 韓国語 + 日本語 + 広東語) | クリックしてください | 地址 |
| VAD + Whisper tiny.en による音声認識 (英語) | クリックしてください | 地址 |
| Moonshine tiny による VAD + 音声認識 (英語) | クリックしてください | 地址 |
| GigaSpeech でトレーニングされた Zipformer を使用した VAD + 音声認識 (英語) | クリックしてください | 地址 |
| WenetSpeech でトレーニングされた Zipformer を使用した VAD + 音声認識 (中国語) | クリックしてください | 地址 |
| ReazonSpeech でトレーニングされた Zipformer を使用した VAD + 音声認識 (日本語) | クリックしてください | 地址 |
| GigaSpeech2 でトレーニングされた Zipformer を使用した VAD + 音声認識 (タイ語) | クリックしてください | 地址 |
| TeleSpeech-ASR CTC モデルによる VAD + 音声認識 (中国語多种方言) | クリックしてください | 地址 |
| Paraformer-large による VAD + 音声認識 (英語 + 中国語、及多种中文方言) | クリックしてください | 地址 |
| Paraformer-small による VAD + 音声認識 (英語 + 中国語、及多种中文方言) | クリックしてください | 地址 |
| 音声合成(英語) | クリックしてください | 地址 |
| 音声合成(ドイツ語) | クリックしてください | 地址 |
| 話者のダイアライゼーション | クリックしてください | 地址 |
| 説明 | URL | 中国用户 |
|---|---|---|
| 話者のダイアライゼーション | 住所 | 点ここ |
| ストリーミング音声認識 | 住所 | 点ここ |
| テキスト読み上げ | 住所 | 点ここ |
| 音声アクティビティ検出 (VAD) | 住所 | 点ここ |
| VAD + 非ストリーミング音声認識 | 住所 | 点ここ |
| 2パス音声認識 | 住所 | 点ここ |
| 音声のタグ付け | 住所 | 点ここ |
| 音声タグ付け (WearOS) | 住所 | 点ここ |
| 話者の識別 | 住所 | 点ここ |
| 音声言語の識別 | 住所 | 点ここ |
| キーワードの発見 | 住所 | 点ここ |
| 説明 | URL | 中国用户 |
|---|---|---|
| ストリーミング音声認識 | 住所 | 点ここ |
| 説明 | URL | 中国用户 |
|---|---|---|
| Android (arm64-v8a、armeabi-v7a、x86_64) | 住所 | 点ここ |
| Linux (x64) | 住所 | 点ここ |
| macOS (x64) | 住所 | 点ここ |
| macOS (arm64) | 住所 | 点ここ |
| Windows (x64) | 住所 | 点ここ |
注: iOS のソースからビルドする必要があります。
| 説明 | URL | 中国用户 |
|---|---|---|
| 字幕生成 (字幕生成) | 住所 | 点ここ |
| 説明 | URL |
|---|---|
| 音声認識 (音声テキスト変換、ASR) | 住所 |
| テキスト読み上げ (TTS) | 住所 |
| VAD | 住所 |
| キーワードの発見 | 住所 |
| 音声のタグ付け | 住所 |
| スピーカー識別 (Speaker ID) | 住所 |
| 音声言語識別 (言語 ID) | 音声認識の多言語 Whisper ASR モデルを確認する |
| 句読点 | 住所 |
| 話者のセグメンテーション | 住所 |
ご覧ください
他のモデルについても。次の表には、その一部のみがリストされています。
| 名前 | サポートされている言語 | 説明 |
|---|---|---|
| sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20 | 中国語、英語 | こちらも参照 |
| sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16 | 中国語、英語 | こちらも参照 |
| シェルパ-onnx-ストリーミング-zipformer-zh-14M-2023-02-23 | 中国語 | Cortex A7 CPUに適しています。こちらも参照 |
| sherpa-onnx-streaming-zipformer-en-20M-2023-02-17 | 英語 | Cortex A7 CPUに適しています。こちらも参照 |
| sherpa-onnx-streaming-zipformer-korean-2024-06-16 | 韓国人 | こちらも参照 |
| シェルパ-onnx-ストリーミング-zipformer-fr-2023-04-14 | フランス語 | こちらも参照 |
ご覧ください
他のモデルについても。次の表には、その一部のみがリストされています。
| 名前 | サポートされている言語 | 説明 |
|---|---|---|
| ささやき tiny.en | 英語 | こちらも参照 |
| ムーンシャイン・タイニー | 英語 | こちらも参照 |
| sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 | 中国語、広東語、英語、韓国語、日本語 | 多种中国語方言をサポートします。こちらも参照 |
| シェルパ-onnx-パラフォーマー-zh-2024-03-09 | 中国語、英語 | 多种中国語方言もサポートします。こちらも参照 |
| sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | 日本語 | こちらも参照 |
| シェルパ-onnx-nemo-transducer-giga-am-russian-2024-10-24 | ロシア | こちらも参照 |
| シェルパ-onnx-nemo-ctc-giga-am-russian-2024-10-24 | ロシア | こちらも参照 |
| シェルパ-onnx-zipformer-ru-2024-09-18 | ロシア | こちらも参照 |
| シェルパ-onnx-zipformer-韓国語-2024-06-24 | 韓国人 | こちらも参照 |
| シェルパ-onnx-zipformer-thai-2024-06-20 | タイ語 | こちらも参照 |
| シェルパ-onnx-テレスピーチ-ctc-int8-zh-2024-06-04 | 中国語 | 複数の方言をサポートします。こちらも参照 |
新一代Kaldi微信交流群とQQ交流群については、https://k2-fsa.github.io/sherpa/social-groups.htmlをご覧ください。
FastAPI で ASR および TTS Python API を使用する方法を示します。
グラフィカル ユーザー インターフェイスを備えた C# でストリーミング ASR を使用します。
中国語のビデオデモ: 【开源】Windows实時字幕软件(网课/开会必备)
sherpa-onnx の JavaScript API と Electron を使用します。
中国語のビデオデモ: 爆了!炫神教你开打字挂!真正影响胜率的英雄联盟工具!英雄联盟的最后一块拼图!和游戏中の每个人無碍沟通!