رهيبة bangla
مجموعة من الأدوات ومجموعات البيانات والموارد على الحوسبة البنغالية. تم تجميع هذه القائمة لمساعدة الباحثين والهواة المهتمين بمعالجة اللغة الطبيعية مع لغة البنغالية (البنغالية). لا تتردد في المساهمة.
أدوات الكتابة ولوحات المفاتيح
منتجات المستخدم النهائي
- لوحة مفاتيح Avro (Windows ، Mac ، Linux ، Ubuntu ، عبر الإنترنت)
- لوحة مفاتيح Ridmik (Android)
- OpenBangla لوحة المفاتيح
- لوحة مفاتيح probhat على الانترنت
- تخطيط لوحة المفاتيح Rokeya
- لوحة مفاتيح Borno (Windows ، Android)
المكتبات
- مكتبة Avro Phonetic (JavaScript ، Go ، C ++)
- ইউনিভার্সাল কিবোর্ড সফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- jquery.ime - يدعم Avro ، probhat ، inscript ، National (BD)
- Bengaliphoneticparser.swift (OpenBangla)
- RUPANTOR - محول/محول صوتي بنغالي مرن للغاية مكتوب في الصدأ. كما يدعم Avro الصوتية. (OpenBangla)
- Bijoy2Unicode - حزمة Python لتحويل ثنائي الاتجاه بين ترميز Bijoy و Unicode Bangla.
مواصفات الإدخال الثابتة والصوتية
Corpora (Corpus) ومجموعات البيانات
- Corpus Builder (Aniruddha Adhikary et al ، Banglakit)
- لغة مستقلة ويكيبيديا نصوص تنزيل
- لغة اللغة الهندية جزء من الكلام: البنغالية (LDC2010T16)
- IARPA Babel Bengali Language Pack IARPA-BABEL103B-V0.4B (LDC2016S08)
- Corpus Banglalekha (الكتابة اليدوية) (Ulab ، دكا)
- Banglawriting: مجموعة بيانات الكتابة اليدوية متعددة الأغراض غير متصل بالإنترنت (Bubt ، Dhaka)
- قائمة الكلمات البنغالية (بنغلا أكاديمي الموز أبهان) (SNLTR)
- مجموعة خطاب البنغالية (IIT ، خراجبور)
- قائمة Stopwords Bengali (STOPWORDS-ISO)
- مجموعة الكلام البنغالية TTS (Google)
- مجموعة بيانات البنغالية الكبيرة ASR (Google)
- إيكوش: شخصيات مكتوبة بخط اليد (DIU ، دكا)
- ISHARA-LIPI: أرقام لغة الإشارة البنغالية (DIU ، دكا
- مجموعة بيانات البنغالية الشائعة
- مجموعة بيانات تفريغ البنغالية ويكيبيديا
- العنوان الفرعي المفتوح البنغالي مجموعة موازية
- Bengali-English Translation Dataset
- أنثى البنغالية مقابل مجموعة بيانات الأسماء الذكور لمهام NLP
- Banglaemotion: مجموعة بيانات مؤيدية لتحليل المشاعر النصي البنغالية (CU ، Chittagong)
- أوسكار: فتح كوربوس فائق الزحف
- BN-HTRD: مجموعة بيانات معيارية لمستند المستندات غير المتصل بالإنترنت التعرف على النص المكتوب بخط اليد (HTR) (PUC ، Chittagong)
- مجموعة بيانات رخصة ترخيص بنغلا (زابر النازي)
- مجموعة بيانات الكلام البنغالية (صوت مشترك ، موزيلا)
أدوات NLP والبرامج النصية والمرافق (المشاريع أيضًا)
أدوات NLP
- Tagger Pos Bangla (HMM/CRF/ME على أساس) (IIT ، Kharagpur)
- Tagger PoS Bangla (SHM0007)
- Tagger بنغلا بوس (UZL)
- Tagger PoS Bangla (مقرها XML) (Sunkuet02)
- Tagger PoS Bangla (القاعدة المستندة) (شريف محمد عبد الله)
- المحلل المورفولوجي (IIT ، خاراجبور)
- chunker (القاعدة المستندة) (IIT ، خاراجبور)
- chunker (إحصائي) (IIT ، خاراجبور)
- محلل التبعية البنغالية (Rajarshi Das et al)
- البنغالية سبت (القاعدة القائمة) (Debasis Ganguly)
- البنغالية ساقا (القاعدة القائمة) (.NET) (تاباس ناياك)
- البنغالية سبت (القاعدة المستندة) (جافا) (تاباس ناياك)
- بنغالي سترايمر (PHP؟) (Md. Tanveer Islam ، Tanveer Ahmed Nayeem)
- بنغالي سترايمر (جافا سكريبت) (ريفات نبي)
- البنغالية سبت (Java) (2015) (Tazim Hoque)
- البنغالية سبت (Java) (2017) (Sudipto Roy)
- تضمين كلمة البنغالية (Md. Afjal Hossain)
- البنغالية Wordnet (Soumen Ganguly)
- تحليل المشاعر البنغالية (دفتر Ipython) (Abhishek Singh)
- استخراج الكلمات الرئيسية (Mahir)
- بنجلا نير (عمرانول أشرفي ، موناسير محمد ، آراني شوكات موري ، جاليب.
- مكتبة البنغالية NLP (BNLP) (ساجور)
- ترجمة نصية من البنغالية إلى البنغالية - حزمة بيثون لـ NLP (Faruk & Sagor)
- نموذج بنغلا بيرت (ساجور)
- [Bangla Word2Vec] (https://github.com/menon92/bangla-word2vec) (Mehadi hasan menon)
- مجموعة أدوات Bangla NLP (Foysal)
قاموس
- قاموس البنغالية المعجمية (2012) (أبهيشيك غوبتا)
- قاموس البنغالية (مينهاس كمال)
- قاموس البنغالية عبر المنصات (GO/QML) (Monir Zaman)
ترجمة آلية بنغلا
- المترجم البنغلا إلى اللغة الإنجليزية (مهدي حسن مينون)
OCR/HTR
- بورنو بنغلا OCR (Bangla.gov.BD)
- البنغالية OCR (KMHASAN)
- البنغالية OCR (CRBLP ، BRACU)
- البنغالية OCR (Fariha Nazmul)
- البنغالية المكتوبة بخط اليد على الحروف الحرفية مع NN التلافييل (Dibyatanoy Bhattacharjee)
- NUMTA تصنيف الأرقام البنغالية المكتوبة بخط اليد باستخدام التعلم النقل (Hasib Zunair ، Nabeel Mohammed ، Sifat Momen)
- التعرف على الأرقام البنغالية (Abhinav Agarwalla)
- تصنيف الأرقام البنغالية (Md. Afjal Hossain)
- BOCRA [حزمة R للبنغالي OCR]
- البنغالية المعرفة الضوئية مع CNN (Sanjiv)
- البنغالية المكتوبة بخط اليد مع CNN (BM ABIR
- توليد البيانات الاصطناعية لـ Bangal OCR (Mehadi Hasan Menon)
- تجزئة الخط والكلمات للتعرف على النص المكتوب بخط اليد (BN-Drishti) (PUC/CU ، Chittagong)
خطاب النص
- voice.bangla.gov.bd
- خطاب بنغلا إلى نص (مهدي حسن مينون)
TTS
- read.bangla.gov.bd
- كاثا - بنغلا TTS (CRBLP ، BRACU)
- البنغالية-هـ (HMM Bangla TTS) (IIT ، Kharagpur)
- Apona Pathok - Bangla TTS (Lost)
- بنجلا TTS (TTS في الوقت الحقيقي (GPU) في الوقت الفعلي (GPU) TTS) (زابير النازي)
متعدد الوسائط
- مقطع (لغة التباين-صورة ما قبل التدريب) تنفيذ بنغلا (زابير النازي)
- الكشف عن خطاب الكراهية متعدد الوسائط من الميمات والنصوص البنغالية (Rezaul Karim)
آحرون
- فحص تعويذة البنغالية (Ankur)
- مدقق إملائي في البنغالية (ماهير ماهبوب)
- باجها - مساعد شخصي (رياد الرحمن)
- تصنيف فئة أخبار بنغلا مع LSTM ثنائية الاتجاه (زابر النازي)
- Aurthohin - مولد نص Bangla
- تدريب وتصور Bangla Word2Vec (Afnan ul Haque Nuhash)
- نظام مطابقة للبحث عن الصور ونص نص في البنغالية باستخدام مقطع (زابير النازي)
البرمجة langauages (؟)
- كورو (اذهب في البنغالية)
- بوتاكا
- شاسكريبت (سيد تانفير جيشان)
- باخي (شافين أشرف)
- Pankti (Palash Bauri)
- البنغالية ألفابيت
مواقع الويب
- جمعية أبحاث تكنولوجيا اللغة الطبيعية
- مركز الأبحاث حول معالجة لغة البنغالية ، Bracu (مرآة النسخ الاحتياطي)
الخطوط
- Bangla.gov.Bd
- lipighor.com