opensource voice tools Download - opensource voice tools Source Code Download

opensource voice tools

كود الذكاء الاصطناعي

1.0.0

تنزيل

قائمة أدوات الصوت مفتوحة المصدر

مقدمة

تقنية الصوت تقلع بشكل كبير. بالنسبة للمؤسسات والشركات والأفراد الذين يحاولون فهم الصوت وحيث يجلس في بنياتهم الفنية ، قد يكون من المربك حقًا فهم عروض المصادر المفتوحة الموجودة هناك.

هذا الريبو عبارة عن قائمة بأدوات صوت مفتوحة المصدر معروفة ، منظمة من خلال تلك الأدوات تجلس في المكدس الصوتي.

النسخ

دوكا ، دانييلا. "تعطيل النسخ - كيف تقوم الأتمتة بتحويل طريقة البحث التأسيسي." تأثير العلوم الاجتماعية (المدونة) ، 17 سبتمبر 2019. https://blogs.lse.ac.uk/impactofsocialsciences/2019/09/17/disrupting-transcription-how-technology-is-transforming-a-

كلمات الاستيقاظ

خطاب النص

موقع إلكتروني	اسم الأداة	رخصة	وصف
openslr.org	موارد لغة الكلام المفتوحة	ن/أ	يديره @Danpovey ، وهو أيضًا مشرف رئيسي لخطاب Kaldi-Asr إلى أداة نصية
Kaldi-asr.org	Kaldi أدوات التعرف على الكلام التلقائي.	Apache 2	واحدة من أولى مجموعات أدوات التعرف على الكلام مفتوحة المصدر. المرجع الأكاديمي هو: `Povey, D., Ghoshal, A., Boulianne, G., Burget, L., Glembek, O., Goel, N., ... & Silovsky, J. (2011). The Kaldi speech recognition toolkit. In IEEE 2011 workshop on automatic speech recognition and understanding (No. CONF). IEEE Signal Processing Society.`

تسليم القصد

قرار النية

رسالة نصية إلى الكلام

موقع إلكتروني	اسم الأداة	رخصة	وصف
FlowTron بواسطة Nvidia	أداة Synthsis الكلام التي تعتمد على Tacotron والتي يمكن تعديلها للملعب و prosody ، تميزها عن تطبيقات TTS الأخرى القائمة على Tacotron	Apache2	تم إصداره لأول مرة في مؤتمر GTC 2020 في مايو 2020. الورقة الأكاديمية هي Avaialble هنا. الاقتباس هو `Valle, R., Shih, K., Prenger, R., & Catanzaro, B. (2020). Flowtron: an Autoregressive Flow-based Generative Network for Text-to-Speech Synthesis. arXiv preprint arXiv:2005.05957.`

مويتي ، ديريك. "دليل 2019 لتوليف الكلام مع التعلم العميق." متوسطة ، 23 يونيو ، 2020.

^ هذه مقالة رائعة تشرح الاختلافات في تطورات أو أجيال من النص إلى الكلام - من التسلسل إلى البارامترية الإحصائية إلى التوليد . مناهج TTS أكثر حداثة مثل Tacotron و Wavenet هي مقاربات توليدية .

أدوات chatbots وأدوات واجهة المستخدم المحادثة

موقع إلكتروني	اسم الأداة	رخصة	وصف
Mindmeld من قبل Cisco	.	Apache2	تعد منصة MindMeld Ai AI من بين أكثر منصات الذكاء الاصطناعى تقدماً لبناء تطبيقات محادثة ذات جودة الإنتاج. إنه إطار تعلم آلي قائم على بيثون والذي يشمل جميع الخوارزميات والمرافق المطلوبة لهذا الغرض. تطورت على مدار عدة سنوات من بناء ونشر العشرات من تجارب المحادثة الأكثر تقدماً ، يتم تحسين MindMeld لبناء مساعدين محادثة متقدمين يوضحون فهمًا عميقًا لحالة أو مجال معين مع توفير تجارب محادثة مفيدة للغاية ومتعددة الاستخدامات. المرجع الأكاديمي لهذه الأداة هو:

Raghuvanshi ، A. ، Carroll ، L. and Raghunathan ، K. ، 2018 ، November. تطوير واجهات المحادثة على مستوى الإنتاج مع التحليل الدلالي الضحل. في وقائع مؤتمر 2018 حول الأساليب التجريبية في معالجة اللغة الطبيعية: مظاهرات النظام (ص. 157-162) |

أغلفة مساعدة صوتية

Mycroft.ai - مساعد صوتي مفتوح المصدر يعمل على مجموعة من الأجهزة المتوافقة مع Linux ، مثل أجهزة X86 أو ARM مثل Raspberry PI. بدعم من مجتمع قوي من مطوري المصادر مفتوحة.
مشروع Oval / Genie في ستانفورد - بتمويل من مؤسسة Alfred P Sloan ومنحة NIST ، يهدف مشروع Stanford Oval إلى توفير بديل مفتوح المصدر لمساعدي الصوت التجارية. المشروع حاليًا في مهده ويحاول بناء مجتمع مفتوح المصدر.

معالجة اللغة الطبيعية (NLP)

Python Natural Language Toolkit NLTK - NLTK هي منصة رائدة لبناء برامج Python للعمل مع بيانات اللغة البشرية. إنه يوفر واجهات سهلة الاستخدام لأكثر من 50 موارد معجمية وموارد معجمية مثل WordNet ، إلى جانب مجموعة من مكتبات معالجة النص للتصنيف ، والرمز ، والنشر ، والعلامة ، والتحليل ، والتفكير الدلالي ، والغلات لمكتبات NLP ذات القوة الصناعية ، ومنتدى مناقشة نشطة.
ECCO Exply - ECCO هي مكتبة Python توفر قابلية للشرح لـ NLP باستخدام التصورات التفاعلية.
Detex Source Code Detex هو إطار عمل عميق لفهم النصوص لمهام التصنيف والتصنيف وتوليد اللغة. إنه يعزز المطابقة الدلالية باستخدام الشبكات العصبية العميقة لفهم نوايا الأعضاء في أنظمة البحث والتوصية. كإطار عام NLP ، يمكن حاليًا تطبيق Detex على العديد من المهام ، بما في ذلك تصنيف البحث والتوصيات ، وتصنيف الطبقة المتعددة ، وفهم الاستعلام. نشرها فريق الذكاء الاصطناعي في LinkedIn.
PGLEX - تم تقديم PGLEX لأول مرة في مؤتمر ICLDC 7 في عام 2021 ، وهي خدمة معجمية "جيدة جدًا" مصممة لتسهيل بناء مواقع القاموس والتطبيقات الأخرى التي تتضمن بيانات معجمية. مع PGLEX ، يمكن للباحثين توفير إدخالات معجمية بتنسيق JSON إلى مثيل من API PGLEX والحصول على نتائج بحث "جيدة جدًا" دون الحاجة إلى تكوينات خاصة باللغة. بنيت على Elasticsearch.

التحيز في المساعدين الصوتيين و NLP

Artie Bias Corpus - مجموعة ومجموعة من الأدوات للكشف عن التحيز الديموغرافي في أنظمة ASR.
[Blodgett ، SL ، Barocas ، S. ، Daumé III ، H. ، & Wallach ، H. (2020). اللغة (التكنولوجيا) هي القوة: دراسة نقدية لـ "التحيز" في NLP. arxiv preprint arxiv: 2005.14050.] https://arxiv.org/pdf/2005.14050.pdf

التعرف على المتحدث

مجموعة أدوات ALISE OPEN SORPER للتعرف على المتحدثين - مجموعة أدوات التعرف على مكبر الصوت عبر المنصات المفتوحة من شركة D'Avignon ، فرنسا.

المحاذاة القسرية

تساعد المحاذاة القسرية على مواءمة التسجيلات الصوتية مع النسخ الإملائي

Aeneas | Docs هي مكتبة Python/C ومجموعة من الأدوات لمزامنة الصوت والنص تلقائيًا (ويعرف أيضًا باسم المحاذاة القسرية).

شركة الصوت واللغة

قاعدة بيانات برلين من الكلام العاطفي - مجموعة معلمة (باللغة الألمانية/دويتشه) من الكلام الموسومة بالعواطف.
الوبر - الوبر عبارة عن مجموعة بيانات 825 من GIB ، مفتوحة المصدر للنمذجة التي تتكون من 22 مجموعة بيانات أصغر حجماً وعالية الجودة مجتمعة معًا.

أدوات تنظيف وإصلاح البيانات

ActivEclean - ActivEclean هو إطار تنظيف تكراري يمكنه إعادة تدريب نموذج التعلم الآلي بشكل صحيح عند تنظيف البيانات ، ويوفر مجموعة من التحسينات لتحديد أفضل البيانات التي يتم تنظيفها. وبهذه الطريقة ، تحتاج فقط إلى تنظيف مجموعة فرعية صغيرة من البيانات من أجل إنتاج نموذج مماثل إذا تم تنظيف مجموعة البيانات الكاملة. مكتوبة في بيثون.
DATALINTER - يحدد مخطط البيانات المشكلات المحتملة (LINTs) في بيانات تدريب ML الخاصة بك.
Holoclean - نظام التعلم الآلي لإثراء البيانات

_ هذا BoostClean أيضًا من جامعة كولومبيا ، لكن لا يمكنني العثور على مرجع رمز في أي مكان على الويب.

الترجمة الآلية

لا توجد لغة تركت وراءها - تصدرها META ، يهدف مشروع NLLB إلى جعل اللغات ذات الموارد المنخفض أكثر سهولة من خلال توفير نموذج ترجمة آلي يمكن أن يترجم بين 200 لغة. يتم تقييم النموذج باستخدام معيار ترجمة بشري ، Flores-200 ، وأداء أفضل بنسبة 44 ٪ من الدرجات الفنية باستخدام Bleu.

قوائم الأوراق

تصنيفات خطاب @Mutiann - يصنف هذا الموقع الأوراق الأكاديمية من خلال الاستشهادات مثل [CSRankings]. وضعت معا من قبل المستخدم mutiann.

مسرد

هناك الكثير من المصطلحات والاختصارات في تكنولوجيا الصوت مفتوحة المصدر. يوفر هذا القسم تفسيرات لكل منهم.

Cognitive arbitration : العملية التي يستخدمها المساعد الصوتي لفهم الخدمات والمهارات المتاحة لها ، اعتمادًا على سياقها - مثل التواصل عبر الإنترنت أو في وضع عدم الاتصال.
CRF : مجال عشوائي مشروط. طريقة النمذجة الإحصائية التي يمكن أن تأخذ في الاعتبار السياق. تستخدم في بعض برامج الاستخراج النية والاستخراج الدلالية القائمة على الشبكة العصبية.
LSTM : ذاكرة طويلة الأجل طويلة. تستخدم في الشبكات العصبية المتكررة للمساعدة في معالجة تسلسل البيانات ، مثل الصوت أو الكلام. من أجل معرفة ما الذي يحتمل أن يأتي بعد ذلك ، يسجل LSTM ما حدث سابقًا .
LVCSR : المفردات الكبيرة التعرف على الكلام. تستخدم في أدوات التعرف على الكلام للإشارة إلى أن المفردات التي لم يتم تقييدها أو تقييدها من أعمال التعرف - على سبيل المثال ، إذا تم نشرها على أجهزة مضمنة أو منخفضة الطاقة والتي لا يمكنها التعامل مع الذاكرة أو حساب متطلبات المفردات الكبيرة و B) يعمل المعترف بشكل مستمر ، على النقيض من كلمة يستيقظ أو كلمة رئيسية تتحكم في CEDES إلى STET.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-24
الحجم 17.74KB
من Github

تطبيقات ذات صلة

language tools

2024-11-11
biliLive tools

2024-11-03
GLM 4 Voice

2024-11-02
sra tools

2024-11-01
أدوات عفريت الصينية

2024-05-16
أدوات PDF24

2023-07-13

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل