| Pengenalan ucapan | Sintesis ucapan |
|---|---|
| ✔️ | ✔️ |
| Identifikasi pembicara | Diarisasi pembicara | Verifikasi pembicara |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| Identifikasi Bahasa Lisan | Penandaan audio | Deteksi aktivitas suara |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| Pencarian kata kunci | Tambahkan tanda baca |
|---|---|
| ✔️ | ✔️ |
| Arsitektur | Android | iOS | jendela | macOS | linux | HarmoniOS |
|---|---|---|---|---|---|---|
| x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
| x86 | ✔️ | ✔️ | ||||
| lengan64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
| lengan32 | ✔️ | ✔️ | ✔️ | |||
| risikocv64 | ✔️ |
| 1.C++ | 2.C | 3. ular piton | 4.JavaScript |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 5. Jawa | 6.C# | 7.Kotlin | 8. Cepat |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 9. Pergi | 10. Anak panah | 11. Karat | 12. Pascal |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
Untuk dukungan Rust, silakan lihat sherpa-rs
Ini juga mendukung WebAssembly.
Repositori ini mendukung menjalankan fungsi-fungsi berikut secara lokal
pada platform dan sistem operasi berikut:
x86_64 , ARM 32-bit, ARM 64-bit (arm64, aarch64), RISC-V (riscv64)dengan API berikut
C#| Keterangan | URL |
|---|---|
| Diarisasi pembicara | Klik saya |
| Pengenalan ucapan | Klik saya |
| Pengenalan ucapan dengan Whisper | Klik saya |
| Sintesis ucapan | Klik saya |
| Hasilkan subtitle | Klik saya |
| Penandaan audio | Klik saya |
| Identifikasi bahasa lisan dengan Whisper | Klik saya |
Kami juga memiliki ruang yang dibangun menggunakan WebAssembly. Mereka tercantum di bawah ini:
| Keterangan | Ruang berpelukan | Ruang ModelScope |
|---|---|---|
| Deteksi aktivitas suara dengan silero-vad | Klik saya | 地址 |
| Pengenalan ucapan waktu nyata (Bahasa Mandarin + Inggris) dengan Zipformer | Klik saya | 地址 |
| Pengenalan ucapan waktu nyata (Bahasa Mandarin + Inggris) dengan Paraformer | Klik saya | 地址 |
| Pengenalan ucapan waktu nyata (Cina + Inggris + Kanton) dengan Paraformer-besar | Klik saya | 地址 |
| Pengenalan ucapan real-time (Bahasa Inggris) | Klik saya | 地址 |
| VAD + pengenalan ucapan (Cina + Inggris + Korea + Jepang + Kanton) dengan SenseVoice | Klik saya | 地址 |
| VAD + pengenalan suara (Bahasa Inggris) dengan Whisper tiny.en | Klik saya | 地址 |
| VAD + pengenalan suara (Bahasa Inggris) dengan Moonshine kecil | Klik saya | 地址 |
| VAD + pengenalan suara (Bahasa Inggris) dengan Zipformer dilatih dengan GigaSpeech | Klik saya | 地址 |
| VAD + pengenalan suara (Cina) dengan Zipformer dilatih dengan WenetSpeech | Klik saya | 地址 |
| VAD + pengenalan suara (Jepang) dengan Zipformer dilatih dengan ReazonSpeech | Klik saya | 地址 |
| VAD + pengenalan suara (Thailand) dengan Zipformer dilatih dengan GigaSpeech2 | Klik saya | 地址 |
| VAD + pengenalan suara (Cina 多种方言) dengan model TeleSpeech-ASR CTC | Klik saya | 地址 |
| VAD + pengenalan ucapan (Bahasa Inggris + Mandarin, 及多种中文方言) dengan Paraformer-large | Klik saya | 地址 |
| VAD + pengenalan suara (Bahasa Inggris + Mandarin, 及多种中文方言) dengan Paraformer-small | Klik saya | 地址 |
| Sintesis ucapan (Bahasa Inggris) | Klik saya | 地址 |
| Sintesis ucapan (Jerman) | Klik saya | 地址 |
| Diarisasi pembicara | Klik saya | 地址 |
| Keterangan | URL | 中国用户 |
|---|---|---|
| Diarisasi pembicara | Alamat | 点此 |
| Pengenalan ucapan streaming | Alamat | 点此 |
| Teks-ke-ucapan | Alamat | 点此 |
| Deteksi aktivitas suara (VAD) | Alamat | 点此 |
| VAD + pengenalan ucapan non-streaming | Alamat | 点此 |
| Pengenalan ucapan dua arah | Alamat | 点此 |
| Penandaan audio | Alamat | 点此 |
| Penandaan audio (WearOS) | Alamat | 点此 |
| Identifikasi pembicara | Alamat | 点此 |
| Identifikasi bahasa lisan | Alamat | 点此 |
| Pencarian kata kunci | Alamat | 点此 |
| Keterangan | URL | 中国用户 |
|---|---|---|
| Pengenalan ucapan streaming | Alamat | 点此 |
| Keterangan | URL | 中国用户 |
|---|---|---|
| Android (arm64-v8a, armeabi-v7a, x86_64) | Alamat | 点此 |
| Linux (x64) | Alamat | 点此 |
| macOS (x64) | Alamat | 点此 |
| macOS (arm64) | Alamat | 点此 |
| jendela (x64) | Alamat | 点此 |
Catatan: Anda perlu membangun dari sumber untuk iOS.
| Keterangan | URL | 中国用户 |
|---|---|---|
| Menghasilkan subtitle (生成字幕) | Alamat | 点此 |
| Keterangan | URL |
|---|---|
| Pengenalan ucapan (ucapan ke teks, ASR) | Alamat |
| Teks-ke-ucapan (TTS) | Alamat |
| VAD | Alamat |
| Pencarian kata kunci | Alamat |
| Penandaan audio | Alamat |
| Identifikasi pembicara (ID Pembicara) | Alamat |
| Identifikasi bahasa lisan (ID Bahasa) | Lihat model Whisper ASR multibahasa dari Pengenalan ucapan |
| tanda baca | Alamat |
| Segmentasi pembicara | Alamat |
Silakan lihat
untuk lebih banyak model. Tabel berikut hanya mencantumkan BEBERAPA di antaranya.
| Nama | Bahasa yang Didukung | Keterangan |
|---|---|---|
| sherpa-onnx-streaming-zipformer-bilingual-zh-id-20-02-2023 | Cina, Inggris | Lihat juga |
| sherpa-onnx-streaming-zipformer-kecil-bilingual-zh-id-2023-02-16 | Cina, Inggris | Lihat juga |
| sherpa-onnx-streaming-zipformer-zh-14M-23-02-2023 | Cina | Cocok untuk CPU Cortex A7. Lihat juga |
| sherpa-onnx-streaming-zipformer-id-20M-2023-02-17 | Bahasa inggris | Cocok untuk CPU Cortex A7. Lihat juga |
| sherpa-onnx-streaming-zipformer-korean-2024-06-16 | Korea | Lihat juga |
| sherpa-onnx-streaming-zipformer-fr-2023-04-14 | Perancis | Lihat juga |
Silakan lihat
untuk lebih banyak model. Tabel berikut hanya mencantumkan BEBERAPA di antaranya.
| Nama | Bahasa yang Didukung | Keterangan |
|---|---|---|
| Bisikan kecil.en | Bahasa inggris | Lihat juga |
| Moonshine kecil | Bahasa inggris | Lihat juga |
| sherpa-onnx-sense-voice-zh-en-ja-ko-yue-17-07-2024 | Cina, Kanton, Inggris, Korea, Jepang | 支持多种中文方言. Lihat juga |
| sherpa-onnx-paraformer-zh-2024-03-09 | Cina, Inggris | 也支持多种中文方言. Lihat juga |
| sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | Jepang | Lihat juga |
| sherpa-onnx-nemo-transduser-giga-am-russian-24-10-2024 | Rusia | Lihat juga |
| sherpa-onnx-nemo-ctc-giga-am-russian-24-10-2024 | Rusia | Lihat juga |
| sherpa-onnx-zipformer-ru-2024-09-18 | Rusia | Lihat juga |
| sherpa-onnx-zipformer-korean-2024-06-24 | Korea | Lihat juga |
| sherpa-onnx-zipformer-thai-2024-06-20 | Thai | Lihat juga |
| sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | Cina | 支持多种方言. Lihat juga |
Silakan lihat https://k2-fsa.github.io/sherpa/social-groups.html untuk 新一代 Kaldi微信交流群dan QQ 交流群.
Ini menunjukkan cara menggunakan ASR dan TTS Python API dengan FastAPI.
Menggunakan streaming ASR di C# dengan antarmuka pengguna grafis.
Demo video dalam bahasa Mandarin: 【开源】Windows实时字幕软件(网课/开会必备)
Ia menggunakan API JavaScript sherpa-onnx bersama dengan Electron
Demo video dalam bahasa Mandarin:爆了!炫神教你开打字挂 Narkoba!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!