| التعرف على الكلام | تركيب الكلام |
|---|---|
| ✔️ | ✔️ |
| تحديد المتحدث | مذكرات المتحدث | التحقق من المتحدث |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| تحديد اللغة المنطوقة | وضع العلامات الصوتية | كشف النشاط الصوتي |
|---|---|---|
| ✔️ | ✔️ | ✔️ |
| اكتشاف الكلمات الرئيسية | إضافة علامات الترقيم |
|---|---|
| ✔️ | ✔️ |
| بنيان | أندرويد | دائرة الرقابة الداخلية | ويندوز | ماك | لينكس | HarmonyOS |
|---|---|---|---|---|---|---|
| x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
| x86 | ✔️ | ✔️ | ||||
| ذراع64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
| ذراع32 | ✔️ | ✔️ | ✔️ | |||
| riscv64 | ✔️ |
| 1. سي ++ | 2. ج | 3. بايثون | 4. جافا سكريبت |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 5. جافا | 6. سي # | 7. كوتلين | 8. سويفت |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
| 9. اذهب | 10. دارت | 11. الصدأ | 12. باسكال |
|---|---|---|---|
| ✔️ | ✔️ | ✔️ | ✔️ |
للحصول على دعم Rust، يرجى مراجعة sherpa-rs
كما أنه يدعم WebAssembly.
يدعم هذا المستودع تشغيل الوظائف التالية محليًا
على المنصات وأنظمة التشغيل التالية:
x86_64 ، 32 بت ARM، 64 بت ARM (arm64، aarch64)، RISC-V (riscv64)مع واجهات برمجة التطبيقات التالية
C#| وصف | عنوان URL |
|---|---|
| مذكرات المتحدث | انقر فوق لي |
| التعرف على الكلام | انقر فوق لي |
| التعرف على الكلام مع الهمس | انقر فوق لي |
| تركيب الكلام | انقر فوق لي |
| توليد ترجمات | انقر فوق لي |
| وضع العلامات الصوتية | انقر فوق لي |
| التعرف على اللغة المنطوقة مع Whisper | انقر فوق لي |
لدينا أيضًا مساحات تم إنشاؤها باستخدام WebAssembly. وهي مدرجة أدناه:
| وصف | مساحة تعانق الوجه | مساحة النموذج |
|---|---|---|
| كشف النشاط الصوتي باستخدام silero-vad | انقر فوق لي | شكرا |
| التعرف على الكلام في الوقت الحقيقي (الصينية + الإنجليزية) مع Zipformer | انقر فوق لي | شكرا |
| التعرف على الكلام في الوقت الحقيقي (الصينية + الإنجليزية) مع Paraformer | انقر فوق لي | شكرا |
| التعرف على الكلام في الوقت الحقيقي (الصينية + الإنجليزية + الكانتونية) مع Paraformer-large | انقر فوق لي | شكرا |
| التعرف على الكلام في الوقت الحقيقي (الإنجليزية) | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الصينية + الإنجليزية + الكورية + اليابانية + الكانتونية) مع SenseVoice | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الإنجليزية) مع Whisper tiny.en | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الإنجليزية) مع Moonshine tiny | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الإنجليزية) مع Zipformer الذي تم تدريبه باستخدام GigaSpeech | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الصينية) مع Zipformer الذي تم تدريبه باستخدام WenetSpeech | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (اليابانية) مع Zipformer الذي تم تدريبه باستخدام ReazonSpeech | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (التايلندي) مع Zipformer الذي تم تدريبه باستخدام GigaSpeech2 | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الصينية 多种方言) مع نموذج TeleSpeech-ASR CTC | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الإنجليزية + الصينية، 及多种中文方言) مع Paraformer-large | انقر فوق لي | شكرا |
| VAD + التعرف على الكلام (الإنجليزية + الصينية، 及多种中文方言) مع Paraformer-small | انقر فوق لي | شكرا |
| تركيب الكلام (الإنجليزية) | انقر فوق لي | شكرا |
| تركيب الكلام (الألمانية) | انقر فوق لي | شكرا |
| مذكرات المتحدث | انقر فوق لي | شكرا |
| وصف | عنوان URL | 中国用户 |
|---|---|---|
| مذكرات المتحدث | عنوان | 点此 |
| تدفق التعرف على الكلام | عنوان | 点此 |
| تحويل النص إلى كلام | عنوان | 点此 |
| اكتشاف النشاط الصوتي (VAD) | عنوان | 点此 |
| VAD + التعرف على الكلام غير المتدفق | عنوان | 点此 |
| التعرف على الكلام ثنائي المرور | عنوان | 点此 |
| وضع العلامات الصوتية | عنوان | 点此 |
| وضع العلامات الصوتية (WearOS) | عنوان | 点此 |
| تحديد المتحدث | عنوان | 点此 |
| تحديد اللغة المنطوقة | عنوان | 点此 |
| اكتشاف الكلمات الرئيسية | عنوان | 点此 |
| وصف | عنوان URL | 中国用户 |
|---|---|---|
| تدفق التعرف على الكلام | عنوان | 点此 |
| وصف | عنوان URL | 中国用户 |
|---|---|---|
| أندرويد (arm64-v8a، Armeabi-v7a، x86_64) | عنوان | 点此 |
| لينكس (x64) | عنوان | 点此 |
| ماك (x64) | عنوان | 点此 |
| ماك (arm64) | عنوان | 点此 |
| ويندوز (x64) | عنوان | 点此 |
ملحوظة: أنت بحاجة إلى البناء من المصدر لنظام iOS.
| وصف | عنوان URL | 中国用户 |
|---|---|---|
| إنشاء ترجمات (生成字幕) | عنوان | 点此 |
| وصف | عنوان URL |
|---|---|
| التعرف على الكلام (تحويل الكلام إلى نص، ASR) | عنوان |
| تحويل النص إلى كلام (TTS) | عنوان |
| مساعدة القيمة المضافة | عنوان |
| اكتشاف الكلمات الرئيسية | عنوان |
| وضع العلامات الصوتية | عنوان |
| تعريف السماعة (معرف السماعة) | عنوان |
| تحديد اللغة المنطوقة (معرف اللغة) | شاهد نماذج Whisper ASR متعددة اللغات من التعرف على الكلام |
| علامات الترقيم | عنوان |
| تجزئة المتحدث | عنوان |
يرجى الاطلاع
لمزيد من النماذج. يسرد الجدول التالي بعضًا منها فقط.
| اسم | اللغات المدعومة | وصف |
|---|---|---|
| sherpa-onnx-streaming-zipformer-ثنائية اللغة-zh-en-2023-02-20 | الصينية، الإنجليزية | انظر أيضا |
| sherpa-onnx-streaming-zipformer-small-ثنائي اللغة-zh-en-2023-02-16 | الصينية، الإنجليزية | انظر أيضا |
| شيربا-onnx-streaming-zipformer-zh-14M-2023-02-23 | الصينية | مناسبة لوحدة المعالجة المركزية Cortex A7. انظر أيضا |
| sherpa-onnx-streaming-zipformer-en-20M-2023-02-17 | إنجليزي | مناسبة لوحدة المعالجة المركزية Cortex A7. انظر أيضا |
| شيربا-onnx-تدفق-zipformer-الكورية-2024-06-16 | كوري | انظر أيضا |
| sherpa-onnx-streaming-zipformer-fr-2023-04-14 | فرنسي | انظر أيضا |
يرجى الاطلاع
لمزيد من النماذج. يسرد الجدول التالي بعضًا منها فقط.
| اسم | اللغات المدعومة | وصف |
|---|---|---|
| الهمس tiny.en | إنجليزي | انظر أيضا |
| لغو صغير | إنجليزي | انظر أيضا |
| شيربا-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 | الصينية، الكانتونية، الإنجليزية، الكورية، اليابانية | 支持多种中文方言. انظر أيضا |
| شيربا-onnx-paraformer-zh-2024-03-09 | الصينية، الإنجليزية | لا داعي للقلق. انظر أيضا |
| شيربا-onnx-zipformer-ja-reazonspeech-2024-08-01 | اليابانية | انظر أيضا |
| شيربا-اوننكس-نيمو-محول-جيجا-ام-روسي-2024-10-24 | الروسية | انظر أيضا |
| شيربا-onnx-نيمو-ctc-جيجا-am-الروسية-2024-10-24 | الروسية | انظر أيضا |
| شيربا-onnx-zipformer-ru-2024-09-18 | الروسية | انظر أيضا |
| شيربا-onnx-zipformer-korean-2024-06-24 | كوري | انظر أيضا |
| شيربا-onnx-zipformer-thai-2024-06-20 | التايلاندية | انظر أيضا |
| شيربا-onnx-telespeech-ctc-int8-zh-2024-06-04 | الصينية | شكرا جزيلا. انظر أيضا |
يرجى الاطلاع على https://k2-fsa.github.io/sherpa/social-groups.html لـ 新一代 Kaldi微信交流群و QQ 交流群.
ويوضح كيفية استخدام ASR وTTS Python APIs مع FastAPI.
يستخدم دفق ASR في C# مع واجهة المستخدم الرسومية.
فيديو توضيحي باللغة الصينية: 【开源】Windows实时字幕软件(网课/开会必备)
يستخدم واجهة برمجة تطبيقات JavaScript الخاصة بـ sherpa-onnx جنبًا إلى جنب مع Electron
عرض فيديو باللغة الصينية:爆了! لا يوجد سبب آخر لذلك!