Bangla yang luar biasa
Kumpulan alat, kumpulan data, dan sumber daya di Komputasi Bangla. Daftar ini dikompilasi untuk membantu para peneliti dan hobi yang tertarik dengan pemrosesan bahasa alami dengan bahasa Bangla (Bengali). Silakan berkontribusi.
Alat pengetik dan keyboard
Produk pengguna akhir
- Avro Keyboard (Windows, Mac, Linux, Ubuntu, Online)
- Keyboard Ridmik (Android)
- Keyboard OpenBangla
- Keyboard ProbHat Online
- Tata Letak Keyboard Rokeya
- Keyboard Borno (Windows, Android)
Perpustakaan
- Avro Fonetic Library (JavaScript, Go, C ++)
- ইউনিভার্সাল কিবোর্ড সফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- JQuery.ime - Mendukung Avro, Probhat, Inscript, National (BD)
- Bengaliphoneticparser.swift (Openbangla)
- Rupantor - Parser/konverter fonetik Bengali yang sangat fleksibel ditulis dengan karat. Ini juga mendukung avro fonetik. (Openbangla)
- Bijoy2unicode - Paket Python untuk konversi dua arah antara encoding Bijoy dan Unicode Bangla.
Spesifikasi input tetap dan fonetik
Korpora (corpus) dan dataset
- Corpus Builder (Aniruddha Adhikary et al, Banglakit)
- Pengunduh corpus teks wikipedia independen bahasa
- Bahasa India Tagset Part-Okua: Bengali (LDC2010T16)
- IARPA BABEL BENGAL PACK BAHASA IARPA-BABEL103B-V0.4B (LDC2016S08)
- Banglalekha corpus (tulisan tangan) (Ulab, Dhaka)
- Banglawriting: Dataset Tulisan Tangan Bangla Multi-Purpose (Bubt, Dhaka)
- Bangla Word-List (Bangla Akademy Banan Abhidhan) (SNLTR)
- Bangla Speech Corpus (IIT, Kharagpur)
- Daftar Stopwords Bengali (Stopwords-ISO)
- Bangla TTS Speech Corpus (Google)
- Dataset ASR Bengali Besar (Google)
- Ekush: Karakter tulisan tangan Bangla (DIU, Dhaka)
- Ishara-lipi: Digit dan Karakter Bahasa Isyarat Bangla (DIU, Dhaka
- Dataset Bengali Besar CommonCrawl
- Dataset Dump Bengali Wikipedia
- Bengali Open Subtitle Parallel Corpus
- Dataset Terjemahan Bengali-Inggris
- Dataset Nama Wanita Bengali Vs Pria untuk Tugas NLP
- Banglaemotion: Dataset Benchmark untuk Analisis Emosi Tekstual Bangla (Cu, Chittagong)
- Oscar: Open Super-Large merayap Almanach Corpus
- BN-HTRD: Dataset Benchmark untuk Level Dokumen Offline Bangla Tangan Teks Pengenalan Teks (HTR) (PUC, Chittagong)
- Dataset Pelat Lisensi Sintetis Bangla (Zabir Al Nazi)
- Dataset Pidato Bengali (Suara Umum, Mozilla)
Alat NLP, skrip, dan utilitas (juga proyek)
Alat NLP
- Bangla Pos Tagger (hmm/crf/me berbasis) (IIT, Kharagpur)
- Bangla Pos Tagger (SHM0007)
- Bangla Pos Tagger (UZL)
- Bangla Pos Tagger (berbasis XML) (Sunkuet02)
- Bangla Pos Tagger (Berbasis Aturan) (Sharif Mohammad Abdullah)
- Penganalisa morfologis (IIT, Kharagpur)
- Chunker (Berbasis Aturan) (IIT, Kharagpur)
- Chunker (statistik) (IIT, Kharagpur)
- Parser Ketergantungan Bengali (Rajarshi Das et al)
- Bengali Stemmer (Berbasis Aturan) (Debasis Ganguly)
- Bengali Stemmer (aturan berbasis) (.net) (tapas nayak)
- Bengali Stemmer (aturan berbasis) (java) (tapas nayak)
- Bengali Stemmer (PHP?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Bengali Stemmer (JavaScript) (RIFAT NABI)
- Bengali Stemmer (Java) (2015) (Tazim Hoque)
- Bengali Stemmer (Java) (2017) (Sudipto Roy)
- Bengali Word Embedding (Md. Afjal Hossain)
- Bengali Wordnet (Soumen Ganguly)
- Analisis Sentimen Bengali (Ipython Notebook) (Abhishek Singh)
- Ekstraksi Kata Kunci (Mahir)
- Bangla Ner (Imranul Ashrafi, Muntasir Mohammad, Arani Shawkat Mauree, Galib Md. Azraf Nijhum, Redwanul Karim, Nabeel Mohammed dan Momen Sifat)
- Perpustakaan Bengali NLP (BNLP) (Sagor)
- Emoji To Bengali Text Translation - Paket Python untuk NLP (Faruk & Sagor)
- Bangla Bert Model (Sagor)
- [Bangla Word2Vec] (https://github.com/menon92/bangla-word2vec) (Mehadi Hasan Menon)
- Bangla NLP Toolkit (Foysal)
Kamus
- Kamus Leksikal Bengali (2012) (Abhishek Gupta)
- Kamus Bengali (Minhas Kamal)
- Kamus Bengali Cross-Platform (GO/QML) (Monir Zaman)
Terjemahan Mesin Bangla
- Bangla to English Translator (Mehadi Hasan Menon)
OCR/HTR
- Borno Bangla OCR (Bangla.gov.bd)
- Bangla OCR (Kmhasan)
- Bangla OCR (CRBLP, Bracu)
- Bangla OCR (Fariha Nazmul)
- OCR Tulisan Tangan Bengali dengan NN Convolutional (Dibyatanoy Bhattacharjee)
- Klasifikasi Digit Bengali Tulis Tangan Numta Menggunakan Pembelajaran Transfer (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- Pengakuan Digit Bengali (Abhinav Agarwalla)
- Klasifikasi Digit Bengali (Md. Afjal Hossain)
- Paket Bocra untuk Bengali OCR]
- Bengali OCR dengan CNN (Sanjiv)
- OCR Tulisan Tangan Bengali dengan CNN (BM Abir
- Generasi Data Sintetis untuk Bangal OCR (Mehadi Hasan Menon)
- Segmentasi baris dan kata untuk pengenalan teks tulisan tangan Bangla (bn-drishti) (puc/cu, chittagong)
Pidato untuk teks
- voice.bangla.gov.bd
- Pidato Bangla untuk SMS (Mehadi Hasan Menon)
Tts
- read.bangla.gov.bd
- Katha - Bangla Tts (CRBLP, Bracu)
- Bengali-HTS (HMM Bangla TTS) (IIT, Kharagpur)
- Apona Pathok - Bangla TTS (Hilang)
- Bangla-tts (Deep CNN Berbasis Real-Time (GPU) TTS) (Zabir al Nazi)
Multi-modal
- Klip (Kontras Bahasa-Image-Image Pra-Pelatihan) Implementasi untuk Bangla (Zabir al Nazi)
- Deteksi wicara kebencian multimodal dari meme dan teks Bengali (Rezaul Karim)
Yang lain
- Pemeriksaan Ejaan Bengali (Ankur)
- Bangla Contestual Spell Checker (Mahir Mahbub)
- Bagha - Asisten Pribadi (Reyad Rahman)
- Klasifikasi Kategori Bangla Berita dengan BIDIRECTIONAL LSTM (Zabir Al Nazi)
- Aurthohin - Generator Teks Bangla Gibberish
- Pelatihan dan Visualisasi Bangla Word2Vec (Afnan Ul Haque Nuhash)
- Pencarian gambar dan sistem pencocokan teks-teks untuk Bangla menggunakan klip (Zabir al Nazi)
Pemrograman langauages (?)
- Koro (pergi di Bangla)
- Potaka
- Chascript (Syed Tanveer Jishan)
- Pakhi (Shafin Ashraf)
- Pankti (Palash Bauri)
- Bengali-Alfabet
Situs web
- Society for Natural Language Technology Research
- Pusat Penelitian tentang Pemrosesan Bahasa Bangla, Bracu (Mirror Cadangan)
Font
- Bangla.gov.bd
- lipighor.com