sherpa onnx
v1.10.34
| 語音辨識 | 語音合成 |
|---|---|
| ✔️ | ✔️ |
| 說話者識別 | 說話者分類 | 說話者驗證 |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| 口語識別 | 音訊標記 | 語音活動偵測 |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| 關鍵字發現 | 新增標點符號 |
|---|---|
| ✔️ | ✔️ |
| 建築學 | 安卓 | iOS系統 | 視窗 | macOS | 作業系統 | 鴻蒙作業系統 |
|---|---|---|---|---|---|---|
| x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
| x86 | ✔️ | ✔️ | ||||
| ARM64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
| 臂32 | ✔️ | ✔️ | ✔️ | |||
| RISCV64 | ✔️ |
| 1.C++ | 2.C | 3.Python | 4. JavaScript |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 5.Java | 6.C# | 7.科特林 | 8.斯威夫特 |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 9. 去吧 | 10. 飛鏢 | 11. 鐵鏽 | 12.帕斯卡 |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
對於 Rust 支持,請參閱 sherpa-rs
它還支援 WebAssembly。
此存儲庫支援在本地運行以下功能
在以下平台和作業系統上:
x86_64位元 ARM、64 位元 ARM(arm64、aarch64)、RISC-V(riscv64)使用以下 API
C#| 描述 | 網址 |
|---|---|
| 說話者分類 | 點我 |
| 語音辨識 | 點我 |
| 使用 Whisper 進行語音識別 | 點我 |
| 語音合成 | 點我 |
| 產生字幕 | 點我 |
| 音訊標記 | 點我 |
| 使用 Whisper 進行口語識別 | 點我 |
我們還有使用 WebAssembly 建置的空間。下面列出了它們:
| 描述 | 抱臉空間 | 模型範圍空間 |
|---|---|---|
| 使用 silero-vad 進行語音活動偵測 | 點我 | 地址 |
| 使用Zipformer進行即時語音辨識(中文+英文) | 點我 | 地址 |
| 使用 Paraformer 進行即時語音辨識(中文+英文) | 點我 | 地址 |
| 使用 Paraformer-large 進行即時語音辨識(中文+英語+粵語) | 點我 | 地址 |
| 即時語音辨識(英文) | 點我 | 地址 |
| VAD + SenseVoice 語音辨識(中文+英語+韓文+日文+粵語) | 點我 | 地址 |
| VAD + 語音辨識(英語),使用 Whisper tiny.en | 點我 | 地址 |
| VAD + 語音辨識(英語)與 Moonshine tiny | 點我 | 地址 |
| VAD + 語音辨識(英語),使用 Zipformer 進行 GigaSpeech 訓練 | 點我 | 地址 |
| VAD + 語音辨識(中文),使用 Zipformer 和 WenetSpeech 進行訓練 | 點我 | 地址 |
| VAD + 語音辨識(日文),使用 Zipformer 進行 ReazonSpeech 訓練 | 點我 | 地址 |
| VAD + 語音辨識(泰語),使用 Zipformer 進行 GigaSpeech2 訓練 | 點我 | 地址 |
| 使用 TeleSpeech-ASR CTC 模型的 VAD + 語音辨識(中文多種方言) | 點我 | 地址 |
| 使用 Paraformer-large 進行 VAD + 語音辨識(英文 + 中文,及多種中文方言) | 點我 | 地址 |
| 使用 Paraformer-small 進行 VAD + 語音辨識(英文 + 中文,及多種中文方言) | 點我 | 地址 |
| 語音合成(英語) | 點我 | 地址 |
| 語音合成(德文) | 點我 | 地址 |
| 說話者分類 | 點我 | 地址 |
| 描述 | 網址 | 中國用戶 |
|---|---|---|
| 說話者分類 | 地址 | 點此 |
| 串流語音識別 | 地址 | 點此 |
| 文字轉語音 | 地址 | 點此 |
| 語音活動檢測 (VAD) | 地址 | 點此 |
| VAD+非串流語音識別 | 地址 | 點此 |
| 二次語音辨識 | 地址 | 點此 |
| 音訊標記 | 地址 | 點此 |
| 音頻標記 (WearOS) | 地址 | 點此 |
| 說話者識別 | 地址 | 點此 |
| 口語識別 | 地址 | 點此 |
| 關鍵字發現 | 地址 | 點此 |
| 描述 | 網址 | 中國用戶 |
|---|---|---|
| 串流語音識別 | 地址 | 點此 |
| 描述 | 網址 | 中國用戶 |
|---|---|---|
| Android(arm64-v8a、armeabi-v7a、x86_64) | 地址 | 點此 |
| Linux (x64) | 地址 | 點此 |
| macOS (x64) | 地址 | 點此 |
| macOS(arm64) | 地址 | 點此 |
| Windows (x64) | 地址 | 點此 |
注意:您需要從 iOS 原始碼建置。
| 描述 | 網址 | 中國用戶 |
|---|---|---|
| 產生字幕 (生成字幕) | 地址 | 點此 |
| 描述 | 網址 |
|---|---|
| 語音辨識(語音轉文字、ASR) | 地址 |
| 文字轉語音 (TTS) | 地址 |
| 虛擬AD | 地址 |
| 關鍵字發現 | 地址 |
| 音訊標記 | 地址 |
| 說話者辨識(Speaker ID) | 地址 |
| 口語辨識(Language ID) | 查看語音辨識中的多語言 Whisper ASR 模型 |
| 標點 | 地址 |
| 說話者分割 | 地址 |
請參閱
了解更多型號。下表僅列出了其中的一些。
| 姓名 | 支援的語言 | 描述 |
|---|---|---|
| sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20 | 中文、英文 | 參見 |
| sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16 | 中文、英文 | 參見 |
| sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23 | 中國人 | 適用於 Cortex A7 CPU。參見 |
| sherpa-onnx-streaming-zipformer-en-20M-2023-02-17 | 英語 | 適用於 Cortex A7 CPU。參見 |
| sherpa-onnx-streaming-zipformer-韓文-2024-06-16 | 韓國人 | 參見 |
| sherpa-onnx-streaming-zipformer-fr-2023-04-14 | 法語 | 參見 |
請參閱
了解更多型號。下表僅列出了其中的一些。
| 姓名 | 支援的語言 | 描述 |
|---|---|---|
| 耳語小.en | 英語 | 參見 |
| 月光小 | 英語 | 參見 |
| sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 | 中文、粵語、英語、韓語、日語 | 支援多種中文方言。參見 |
| sherpa-onnx-paraformer-zh-2024-03-09 | 中文、英文 | 也支援多種中文方言。參見 |
| sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | 日本人 | 參見 |
| 夏爾巴人-onnx-nemo-感測器-giga-am-俄羅斯-2024-10-24 | 俄文 | 參見 |
| 夏爾巴人-onnx-nemo-ctc-giga-am-俄羅斯-2024-10-24 | 俄文 | 參見 |
| 夏爾巴人-onnx-zipformer-ru-2024-09-18 | 俄文 | 參見 |
| sherpa-onnx-zipformer-韓文-2024-06-24 | 韓國人 | 參見 |
| sherpa-onnx-zipformer-泰國-2024-06-20 | 泰國 | 參見 |
| sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | 中國人 | 支持多種方言。參見 |
新一代Kaldi微信交流群與QQ交流群請參考https://k2-fsa.github.io/sherpa/social-groups.html。
它展示瞭如何將 ASR 和 TTS Python API 與 FastAPI 結合使用。
使用 C# 中的串流 ASR 和圖形使用者介面。
中文影片示範:【】Windows即時字幕軟體開源(網課/開會必備)
它使用 sherpa-onnx 的 JavaScript API 以及 Electron
中文影片示範:爆了!