Awesome-Bangla
การรวบรวมเครื่องมือชุดข้อมูลและทรัพยากรเกี่ยวกับการคำนวณของ Bangla รายการนี้ถูกรวบรวมเพื่อช่วยให้นักวิจัยและงานอดิเรกที่สนใจในการประมวลผลภาษาธรรมชาติด้วยภาษา Bangla (Bengali) โปรดอย่าลังเลที่จะมีส่วนร่วม
เครื่องมือพิมพ์และคีย์บอร์ด
ผลิตภัณฑ์ปลายทางผู้ใช้
- Avro Keyboard (Windows, Mac, Linux, Ubuntu, ออนไลน์)
- Ridmik Keyboard (Android)
- คีย์บอร์ด OpenBangla
- คีย์บอร์ด Probhat ออนไลน์
- เค้าโครงคีย์บอร์ด Rokeya
- คีย์บอร์ด Borno (Windows, Android)
ห้องสมุด
- Avro Phonetic Library (JavaScript, GO, C ++)
- ইউনিভার্সালসফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- jQuery.ime - สนับสนุน Avro, Probhat, Inscript, National (BD)
- Bengaliphoneticparser.swift (OpenBangla)
- Rupantor - ตัวแยกวิเคราะห์การออกเสียงเบงกาลีที่ยืดหยุ่นมาก/ตัวแปลงที่เขียนด้วยสนิม นอกจากนี้ยังรองรับการออกเสียง Avro (OpenBangla)
- Bijoy2unicode - แพ็คเกจ Python สำหรับการแปลงแบบสองทิศทางระหว่างการเข้ารหัส Bijoy และ Unicode Bangla
ข้อกำหนดอินพุตคงที่และการออกเสียง
Corpora (Corpus) และชุดข้อมูล
- Corpus Builder (Aniruddha Adhikary et al, Banglakit)
- Downloader Text Text Wikipedia Language Language
- ภาษาอินเดียส่วนหนึ่งของการพูดภาษาแท็ก: เบงกาลี (LDC2010T16)
- IARPA BABEL BENGALI PACK IARPA-BABEL103B-V0.4B (LDC2016S08)
- Banglalekha Corpus (ลายมือ) (Ulab, Dhaka)
- BANGLAWRITING: ชุดข้อมูลการเขียนด้วยลายมือแบบออฟไลน์อเนกประสงค์ (Bubt, Dhaka)
- Bangla Word-List (Bangla Akademy Banan Abhidhan) (SNLTR)
- Bangla Speech Corpus (IIT, Kharagpur)
- Bengali Stopwords List (Stopwords-ISO)
- Bangla TTS Speech Corpus (Google)
- ชุดข้อมูล ASR เบงกาลีขนาดใหญ่ (Google)
- Ekush: Bangla ตัวละครที่เขียนด้วยลายมือ (Diu, Dhaka)
- Ishara-Lipi: ตัวเลขภาษาและตัวละครของ Bangla (Diu, Dhaka
- ชุดข้อมูล Bengali Large Commoncrawl
- ชุดข้อมูลการถ่ายโอนข้อมูล Bengali Wikipedia
- Bengali Open Subtitle Corpus
- ชุดข้อมูลการแปลภาษาเบงกาลิ-อังกฤษ
- ชุดข้อมูล Bengali Female Vs Male ชื่อสำหรับงาน NLP
- Banglaemotion: ชุดข้อมูลมาตรฐานสำหรับการวิเคราะห์อารมณ์ความรู้สึกของ Bangla (Cu, Chittagong)
- ออสการ์: Open Super Large Crawled Almanach Corpus
- BN-HTRD: ชุดข้อมูลมาตรฐานสำหรับระดับเอกสารออฟไลน์การรับรู้ข้อความที่เขียนด้วยลายมือ (HTR) (PUC, Chittagong)
- ชุดข้อมูลแผ่นป้ายทะเบียนสังเคราะห์ของ Bangla (Zabir Al Nazi)
- ชุดข้อมูลคำพูดภาษาเบงกาลี (เสียงทั่วไป, Mozilla)
เครื่องมือ NLP สคริปต์และยูทิลิตี้ (เช่นโครงการ)
เครื่องมือ NLP
- Bangla POS Tagger (อืม HMM/CRF/ME) (IIT, Kharagpur)
- Bangla POS Tagger (SHM0007)
- Bangla POS Tagger (UZL)
- Bangla POS Tagger (อิง XML) (Sunkuet02)
- Bangla POS Tagger (ตามกฎ) (Sharif Mohammad Abdullah)
- เครื่องวิเคราะห์ทางสัณฐานวิทยา (IIT, Kharagpur)
- Chunker (ตามกฎ) (IIT, Kharagpur)
- Chunker (สถิติ) (IIT, Kharagpur)
- ตัวแยกวิเคราะห์การพึ่งพาเบงกาลี (Rajarshi Das et al)
- Bengali Stemmer (ตามกฎ) (Debasis Ganguly)
- Bengali Stemmer (ตามกฎ) (.NET) (Tapas Nayak)
- Bengali Stemmer (ตามกฎ) (Java) (Tapas Nayak)
- Bengali Stemmer (PHP?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Bengali Stemmer (JavaScript) (Rifat Nabi)
- Bengali Stemmer (Java) (2015) (Tazim Hoque)
- Bengali Stemmer (Java) (2017) (Sudipto Roy)
- การฝังคำภาษาเบงกาลี (Md. Afjal Hossain)
- Bengali Wordnet (Soumen Ganguly)
- การวิเคราะห์ความเชื่อมั่นของเบงกาลี (สมุดบันทึก Ipython) (Abhishek Singh)
- การสกัดคำหลัก (mahir)
- Bangla Ner (Imranul Ashrafi, Muntasir Mohammad, Arani Shawkat Mauree, Galib Md. Azraf Nijhum, Redwanul Karim, Nabeel Mohammed และ Sifat Momen)
- Bengali NLP Library (BNLP) (SAGOR)
- Emoji to Bengali Text Translation - แพ็คเกจ Python สำหรับ NLP (Faruk & Sagor)
- Bangla Bert Model (Sagor)
- [Bangla Word2vec] (https://github.com/menon92/bangla-word2vec) (Mehadi Hasan Menon)
- Bangla NLP Toolkit (Foysal)
พจนานุกรม
- พจนานุกรมคำศัพท์เบงกาลี (2012) (Abhishek Gupta)
- พจนานุกรมเบงกาลี (Minhas Kamal)
- พจนานุกรมข้ามแพลตฟอร์มเบงกาลี (GO/QML) (Monir Zaman)
การแปลเครื่องบางลา
- Bangla to English Translator (Mehadi Hasan Menon)
OCR/HTR
- Borno Bangla OCR (bangla.gov.bd)
- Bangla OCR (KMHASAN)
- Bangla OCR (CRBLP, BRACU)
- Bangla OCR (Fariha Nazmul)
- Bengali ที่เขียนด้วยลายมือ OCR กับ Convolutional NN (Dibyatanoy Bhattacharjee)
- การจำแนกประเภท Bengali Digit ที่เขียนด้วยลายมือโดยใช้การเรียนรู้การถ่ายโอน (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- การรับรู้หลักของเบงกาลี (Abhinav Agarwalla)
- การจำแนกประเภทของเบงกาลี (Md. Afjal Hossain)
- Bocra [แพ็คเกจสำหรับ Bengali OCR]
- Bengali OCR กับ CNN (Sanjiv)
- Bengali ที่เขียนด้วยลายมือ OCR กับ CNN (BM ABIR
- การสร้างข้อมูลสังเคราะห์สำหรับ Bangal OCR (Mehadi Hasan Menon)
- การแบ่งส่วนบรรทัดและคำสำหรับการจดจำข้อความที่เขียนด้วยลายมือของบางลา (BN-Drishti) (PUC/CU, Chittagong)
คำพูดถึงข้อความ
- Voice.bangla.gov.bd
- Bangla Speech to text (Mehadi Hasan Menon)
TTS
- read.bangla.gov.bd
- Katha - Bangla TTS (CRBLP, BRACU)
- Bengali-HTS (Bangla TTS ที่ใช้ HMM) (IIT, Kharagpur)
- Apona Pathok - Bangla TTS (Lost)
- Bangla-TTS (Deep CNN ตามเวลาจริง (GPU) TTS) (Zabir al Nazi)
หลายรูปแบบ
- การใช้งานคลิป (ภาษาที่ตัดกัน-ภาพก่อนการฝึกอบรม) สำหรับบางลา (Zabir al Nazi)
- การตรวจจับคำพูดแสดงความเกลียดชังหลายรูปแบบจากมส์เบงกาลีและข้อความ (Rezaul Karim)
คนอื่น
- การตรวจสอบคาถาเบงกาลี (Ankur)
- Bangla Confitentual Checker (Mahir Mahbub)
- Bagha - ผู้ช่วยส่วนตัว (Reyad Rahman)
- การจำแนกหมวดหมู่ข่าวของ Bangla กับ LSTM แบบสองทิศทาง (Zabir Al Nazi)
- Aurthohin - Gibberish Bangla Text Generator
- การฝึกอบรมและการสร้างภาพข้อมูล Bangla Word2vec (Afnan ul Haque Nuhash)
- การค้นหารูปภาพและระบบการจับคู่ข้อความรูปภาพสำหรับบางลาโดยใช้คลิป (Zabir al Nazi)
การเขียนโปรแกรม langauages (?)
- Koro (ไปที่บางลา)
- โปทาก้า
- Chascript (Syed Tanveer Jishan)
- Pakhi (Shafin Ashraf)
- Pankti (Palash Bauri)
- เบงกอล
เว็บไซต์
- สมาคมวิจัยเทคโนโลยีภาษาธรรมชาติ
- ศูนย์การวิจัยเกี่ยวกับการประมวลผลภาษาบางลา, BRACU (กระจกสำรอง)
แบบอักษร
- bangla.gov.bd
- lipighor.com