génial-bangla
Une collection d'outils, de jeux de données et de ressources sur Bangla Computing. Cette liste a été compilée pour aider les chercheurs et les amateurs intéressés par le traitement du langage naturel avec la langue Bangla (bengali). N'hésitez pas à contribuer.
Outils de saisie et claviers
Produits de l'utilisateur final
- Clavier Avro (Windows, Mac, Linux, Ubuntu, en ligne)
- Clavier Ridmik (Android)
- Clavier OpenBangla
- Clavier probhat en ligne
- Disposition du clavier Rokeya
- Borno Clavier (Windows, Android)
Bibliothèques
- Avro Phonetic Library (JavaScript, Go, C ++)
- ইউনিভার্সাল কিবোর্ড সফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- jQuery.Ime - Soutient Avro, Probhat, INSCRICT, National (BD)
- BengaliphoneticPaSer.swift (OpenBangla)
- RUPANTOR - Un analyseur / convertisseur phonétique bengali très flexible écrit en rouille. Il prend également en charge Avro Phonétique. (OpenBangla)
- Bijoy2Unicode - un package Python pour la conversion bidirectionnelle entre le codage de Bijoy et Unicode Bangla.
Spécifications d'entrée fixe et phonétique
- Méthodes d'entrée bengali
Corpus (corpus) et ensembles de données
- Corpus Builder (Aniruddha Adhikary et al, Banglakit)
- Un téléchargeur de corpus de texte wikipedia indépendant de la langue
- Tagset de partie du discours de langue indienne: Bengali (LDC2010T16)
- IARPA BABEL BENGALI LANGUE PACK IARPA-BABEL103B-V0.4B (LDC2016S08)
- Banglalekha Corpus (écriture manuscrite) (Ulab, Dhaka)
- Banglawriting: un ensemble de données de rédaction de bangla hors ligne multipulaire (bubt, dhaka)
- Bangla Word-list (Bangla Akademy Banan Abhidhan) (Snltr)
- Bangla Speech Corpus (IIT, Kharagpur)
- Liste des mots arrêtés bengali (Mords d'étape-ISO)
- Bangla TTS Speech Corpus (Google)
- Grand ensemble de données bengali ASR (Google)
- Ekush: Characles manuscrits Bangla (Diu, Dhaka)
- Ishara-lipi: chiffres et personnages de la langue des signes bangla (Diu, Dhaka
- Bengali grand ensemble de données CommonCrawl
- Ensemble de données de vidage bengali wikipedia
- Corpus parallèle de sous-titre ouvert bengali
- Ensemble de données de traduction en anglais bengali
- Bengali Femme vs Noms masculins Dataset pour les tâches NLP
- Banglamotion: un ensemble de données de référence pour l'analyse des émotions textuelles de Bangla (CU, Chittagong)
- Oscar: Corpus Almanach super grand ouvert a rampé
- BN-HTRD: un ensemble de données de référence pour le niveau de document hors ligne Bangla Reconnaissance de texte manuscrite (HTR) (PUC, Chittagong)
- Ensemble de données de plaques d'immatriculation synthétiques de Bangla (Zabir al Nazi)
- Ensemble de données de discours bengali (voix commune, Mozilla)
Outils, scripts et utilitaires PNL (également projets)
Outils PNL
- Bangla Pos Tagger (Hmm / CRF / ME basé) (IIT, Kharagpur)
- Bangla Pos Tagger (Shm0007)
- Bangla Pos Tagger (UZL)
- Bangla Pos Tagger (basé sur XML) (Sunkuet02)
- Bangla Pos Tagger (basé sur des règles) (Sharif Mohammad Abdullah)
- Analyseur morphologique (IIT, Kharagpur)
- Chunker (basé sur des règles) (IIT, Kharagpur)
- Chunker (statistique) (IIT, Kharagpur)
- Parser de dépendance bengali (Rajarshi Das et al)
- Bengali STEMMER (basé sur les règles) (Debasis Ganguly)
- Bengali STEMMER (basé sur des règles) (.NET) (Tapas Nayak)
- Bengali STEMMER (basé sur des règles) (Java) (tapas nayak)
- Bengali STEMMER (PHP?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Bengali STEMMER (Javascript) (Rifat Nabi)
- Bengali STEMMER (Java) (2015) (Tazim Hoque)
- Bengali STEMMER (Java) (2017) (Sudipto Roy)
- Bengali Word Embedding (Md. Afjal Hossain)
- Bengali Wordnet (Soumen Ganguly)
- Analyse des sentiments bengali (cahier IPython) (Abhishek Singh)
- Extraction de mots clés (Mahir)
- Bangla Ner (Imranul Ashrafi, Muntasir Mohammad, Arani Shawkat Mauree, Galib Md. Azraf Nijhum, Redwanul Karim, Nabeel Mohammed et Sifat Momen)
- Bibliothèque Bengali NLP (BNLP) (Sagor)
- Emoji to Bengali Text Translation - Python Package pour NLP (Faruk & Sagor)
- Bangla Bert Model (Sagor)
- [Bangla Word2Vec] (https://github.com/menon92/bangla-word2vec) (Mehadi Hasan Menon)
- Bangla NLP Toolkit (Foysal)
Dictionnaire
- Dictionnaire lexical bengali (2012) (Abhishek Gupta)
- Dictionnaire bengali (Minhas Kamal)
- Dictionnaire bengali multiplateforme (GO / QML) (Monir Zaman)
Bangla Machine Traduction
- Bangla au traducteur anglais (Mehadi Hasan Menon)
OCR / HTR
- Borno Bangla OCR (Bangla.gov.bd)
- Bangla OCR (Kmhasan)
- Bangla OCR (CRBLP, Bracu)
- Bangla OCR (Fariha Nazmul)
- OCR manuscrit bengali avec NN convolutionnel (Dibyatanoy Bhattacharjee)
- Classification de chiffres bengali manuscrit de Numta à l'aide d'un apprentissage par transfert (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- Reconnaissance du chiffre bengali (Abhinav Agarwalla)
- Classification des chiffres bengali (Md. Afjal Hossain)
- Bocra [R package pour Bengali OCR]
- OCR bengali avec CNN (Sanjiv)
- OCR manuscrit bengali avec CNN (BM Abir
- Génération de données synthétiques pour Bangal OCR (Mehadi Hasan Menon)
- Segmentation des lignes et des mots pour la reconnaissance manuscrite de Bangla (BN-Drishti) (PUC / CU, Chittagong)
Discours au texte
- Voice.bangla.gov.bd
- Bangla Speech to Sext (Mehadi Hasan Menon)
Tts
- read.bangla.gov.bd
- Katha - Bangla Tts (Crblp, Bracu)
- Bengali-hts (Bangla TTS basé à HMM) (IIT, Kharagpur)
- Apona Pathok - Bangla Tts (perdu)
- Bangla-Tts (TTS en temps réel basé sur CNN (GPU)) (Zabir Al Nazi)
Multi-modal
- Clip (Langue contrastive-image pré-formation) Implémentation pour Bangla (Zabir Al Nazi)
- Détection de discours de haine multimodale à partir de mèmes et de textes bengali (Rezaul Karim)
Autres
- Vérification des orthographes bengali (Ankur)
- Bangla Contextual Spell Checker (Mahir Mahbub)
- Bagha - Assistant personnel (Reyad Rahman)
- Bangla News Catégorie Classification avec LSTM bidirectionnel (Zabir Al Nazi)
- Aurthohin - générateur de texte bangla en gibbier
- Bangla Word2Vec Training and Visualisation (Afnan Ul Haque Nuhash)
- Un système de recherche d'image et de texte de texte pour Bangla à l'aide de Clip (Zabir al Nazi)
Programmation Langauages (?)
- Koro (allez à Bangla)
- Potaka
- Chascript (Syed Tanveer Jishan)
- Pakhi (Shafin Ashraf)
- Pankti (Palash Bauri)
- Alphabet bengali
Sites Web
- Société pour la recherche en technologie du langage naturel
- Center for Research on Bangla Language Processing, Bracu (Backup Mirror)
Polices
- bangla.gov.bd
- lipighor.com