Whisper هو نظام التعرف على الكلام مفتوح المصدر الذي تم تطويره بواسطة Openai
محتويات
- رسمي
- المتغيرات النموذجية
- التطبيقات
- تطبيقات الويب
- أدوات CLI
- ملاعب
- حزم
- مقالات
- مقاطع الفيديو
- مجتمع
- واجهات برمجة تطبيقات الطرف الثالث
- القوائم ذات الصلة
رسمي
- مقدمة
- رمز المصدر
- ورقة بيضاء
المتغيرات النموذجية
- Whisper.cpp - ميناء الهامس في C ++.
- Whisperx - يضيف التعرف على مكبر الصوت التلقائي السريع مع الطوابع الزمنية على مستوى الكلمات ومؤسسة مكبر الصوت.
- أسرع - whisper - تعويض أسرع من الهمس باستخدام ctranslate2.
- Whisper Jax - Jax تنفيذ Whisper لما يصل إلى 70x تسريع على TPU.
- Whisper-timestamped-يضيف الطوابع الزمنية على مستوى الكلمات وعشرات الثقة.
- Whisper -Openvino - Whisper يركض على Openvino.
- Whisper.tflite - Whisper يعمل على Tensorflow Lite.
- متغيرات الهمس - مختلف المتغيرات الهاوية على وجوه المعانقة.
- Whisper-at-Whisper يمكنه التعرف على الأحداث الصوتية غير الكلام بالإضافة إلى الكلام.
التطبيقات
- Aiko - Audio Transcription iOS و MacOS App.
- MACWHISPER - Audio Transcription MacOS App. (فريميوم)
- مذكرات الهمس - تطبيق iOS Transcription Audio. (فريميوم)
- Fouryou - Audio Journal iOS App.
- JOJO TRASSCRINCE - AUDIO TRESSCRINCHING MACOS APP.
- Buzz - Audio Transcription and Translation MacOS App.
- Whisperscript - Audio Transcription MacOS App. (Freemium · الإلكترون)
- المنصة الصوتية - تطبيق MACOS لإدارة الصوت/الفيديو.
- Superwhisper - تطبيق Global Audio Transcription MacOS Menu Menu.
- ملاحظة الكلام - تطبيق Linux النسخ الصوتي.
- FridayGPT - تطبيق تطبيق MacOS مدعوم من Openai API.
- EasyWhisper - تطبيق Windows و MacOS لنسخ الصوت ومؤسسة مكبر الصوت. (فريميوم)
تطبيقات الويب
استضاف
- BigWav - أداة النسخ والشرح الصوتي.
- نسخ بودكاست مجاني - يعمل محليًا في متصفحك.
- Gladia - النسخ مع المعالجة في الوقت الفعلي.
مستضافة ذاتي
- AI الفرعية - توليد الترجمة.
- WAAS - واجهة المستخدم الرسومية و API للهمس.
- Writeout.ai - تطبيق Laravel لنسخ وترجمة الملفات الصوتية.
- Meeper - النسخ ، الملخص والمزيد للاجتماعات وأي علامة تبويب المتصفح. (تطبيق Chrome)
أدوات CLI
- yt -whisper - توليد الترجمة الفرعية على YouTube.
- Phonix - توليد التسميات التوضيحية لمقاطع الفيديو.
- Whisper-Standalone-Wain-Windows المستقلة قابلة للتنفيذ للهمسة والهمسة بشكل أسرع.
- Whisper-Ctranslate2-أداة سطر الأوامر الهامس على أساس Ctranslate2 ، متوافق مع الأصل.
- بجنون السرعة المجنون-حقق سرعات النسخ بالقرب من 30x في الوقت الفعلي مع العديد من التحسينات.
- همسة - التعرف على الكلام التلقائي مع مذكرات المتحدث.
ملاعب
- الوجوه المعانقة - العرض التجريبي الهمس على وجوه المعانقة. (مصدر)
- Monster API - Whisper Demo تشغيل على API Monster. (مصدر)
- Web Whisper - Whisper Demo by Pluja. (مصدر)
- YouTube نسخ فيديو - تشغيل على كولاب.
حزم
جافا سكريبت
- الاستخدام - whisper - رد الفعل.
مقالات
- همسات مستقبل AI المعياري-يكمن مستقبل التعلم الآلي في برامج نقل الكلام مفتوحة المصدر القابلة للتكيف ويمكن الوصول إليها.
- كيفية تشغيل نموذج التعرف على الكلام الهامس - يشرح كيفية تثبيت وتشغيل النموذج ، بالإضافة إلى توفير تحليل أداء يقارن الهمس بالنماذج الأخرى.
- قم بإنشاء خطابك الخاص إلى تطبيق النص باستخدام Flask-يوضح البرنامج التعليمي نموذج Whisper للكلام إلى النص ، مع عرض توضيحي عند تشغيله في دفتر متدرج ودليل لإعداد تطبيق Flask مع نشرات التدرج.
- قم بتحويل Podcasts إلى Text-البرنامج التعليمي على واجهة برمجة تطبيقات Whisper مع Python لنسخ الكلام إلى النص ، وعرض النسخ الأسرع والتكنولوجيا المتقدمة ل GPU.
مقاطع الفيديو
- افتتاح الهمس من الذكاء الاصطناعي مذهل! - مقدمة إلى الهمس.
- كيفية القيام بنسخ حرية التعبير إلى النص أفضل من Google Premium API-البرنامج التعليمي.
- التطبيق متعدد اللغات من الذكاء الاصطناعي التعرف على الحية - البرنامج التعليمي.
مجتمع
واجهات برمجة تطبيقات الطرف الثالث
واجهات برمجة التطبيقات التي تستخدم الهمس.
- Whisper+ - امتداد نموذج Whisper الذي يضيف ميزات قوية مثل تحديد مخصص المفردات المخصصة للسماعات ، والتلخيص ، وجيل الفصل.
- النسخ المتماثل - استخدم Whisper تشغيل على النسخ المتماثل.
القوائم ذات الصلة
- رهيبة chatgpt - موارد ChatGpt.