很棒的邦格拉
孟加拉计算上的工具,数据集和资源集合。该列表旨在帮助对孟加拉语(孟加拉语)语言感兴趣的研究人员和业余爱好者。请随时做出贡献。
打字工具和键盘
最终用户产品
- AVRO键盘(Windows,Mac,Linux,Ubuntu,在线)
- RIDMIK键盘(Android)
- OpenBangla键盘
- 在线Probhat键盘
- Rokeya键盘布局
- Borno键盘(Windows,Android)
库
- Avro语音库(JavaScript,GO,C ++)
- ইউনিভার্সালইউনিভার্সালসফটওয়্যার'ইউবোর্ড' / uboard [bangla.gov.bd]
- jQuery.im-支持Avro,Probhat,instript,National(BD)
- 孟加拉国人。
- Rupantor-一个非常灵活的孟加拉语音解析器/用Rust编写的转换器。它还支持Avro语音。 (OpenBangla)
- Bijoy2unicode- Bijoy编码和Unicode Bangla之间的双向转换的Python包装。
固定和语音输入规格
语料库(语料库)和数据集
- Corpus Builder(Aniruddha Adhikary等,Banglakit)
- 语言独立的Wikipedia文本语料库下载器
- 印度语言部分的标语:孟加拉语(LDC2010T16)
- IARPA BABEL BENGALI语言包IARPA-BABEL103B-V0.4B(LDC2016S08)
- 孟加拉国语料库(手写)(乌拉布,达卡)
- Banglawriting:多功能离线孟加拉手写数据集(Bubt,Dhaka)
- Bangla Word-List(Bangla Akademy Banan Abhidhan)(SNLTR)
- 孟加拉语料库(IIT,Kharagpur)
- 孟加拉语停止词列表(stopwords-iso)
- 孟加拉语TTS语音(Google)
- 大型孟加拉ASR数据集(Google)
- Ekush:孟加拉语手写字符(DIU,达卡)
- Ishara-Lipi:孟加拉语手语数字和角色(达卡Diu
- 孟加拉大型公共数据集
- 孟加拉Wikipedia dump数据集
- 孟加拉开放字幕平行语料库
- 孟加拉语英语翻译数据集
- NLP任务的孟加拉女性与男性名字数据集
- 孟加拉国:用于孟加拉文字情感分析的基准数据集(CU,吉大港)
- 奥斯卡:开放式超大爬行爬行的Anmanach Copus
- BN-HTRD:文档级别脱机的基准数据集,孟加拉语手写文本识别(HTR)(PUC,Chittagong)
- 孟加拉综合车牌数据集(Zabir al Nazi)
- 孟加拉语语音数据集(Common Voice,Mozilla)
NLP工具,脚本和实用程序(也项目)
NLP工具
- Bangla POS Tagger(hmm/crf/Me基于)(IIT,Kharagpur)
- Bangla Pos Tagger(SHM0007)
- Bangla Pos Tagger(UZL)
- Bangla POS Tagger(基于XML)(Sunkuet02)
- Bangla Pos Tagger(基于规则)(Sharif Mohammad Abdullah)
- 形态分析仪(IIT,Kharagpur)
- Chunker(基于规则)(IIT,Kharagpur)
- Chunker(统计)(IIT,Kharagpur)
- 孟加拉依赖性解析器(Rajarshi Das等人)
- 孟加拉人(基于规则)(debasis ganguly)
- 孟加拉词干(基于规则)(.net)(Tapas nayak)
- 孟加拉茎(基于规则)(Java)(Tapas nayak)
- 孟加拉人(PHP?)(Md。TanveerIslam,Tanveer Ahmed Nayeem)
- 孟加拉词干(JavaScript)(Rifat Nabi)
- 孟加拉词者(Java)(2015)(Tazim Hoque)
- 孟加拉词干(Java)(2017)(Sudipto Roy)
- 孟加拉语嵌入(Md。AfjalHossain)
- 孟加拉文章(Soumen Ganguly)
- 孟加拉情绪分析(Ipython笔记本)(Abhishek Singh)
- 关键字提取(Mahir)
- Bangla Ner(Imranul Ashrafi,Muntasir Mohammad,Arani Shawkat Mauree,GalibMd。AzrafNijhum,Redwanul Karim,Nabeel Mohammed和Sifat Momen)
- 孟加拉国NLP库(BNLP)(SAGOR)
- 表情符号到孟加拉文本翻译 - NLP的Python包(Faruk&Sagor)
- Bangla Bert模型(Sagor)
- [Bangla Word2Vec](https://github.com/menon92/bangla-word2vec)(Mehadi Hasan Menon)
- Bangla NLP工具包(Foysal)
字典
- 孟加拉语词汇词典(2012)(Abhishek Gupta)
- 孟加拉语词典(Minhas Kamal)
- 跨平台孟加拉语字典(GO/QML)(Monir Zaman)
孟加拉机器翻译
- 孟加拉语到英语翻译(Mehadi Hasan Menon)
OCR/HTR
- Borno Bangla OCR(Bangla.gov.bd)
- 孟加拉OCR(KMHASAN)
- Bangla OCR(CRBLP,Bracu)
- Bangla OCR(Fariha Nazmul)
- 孟加拉语手写OCR与卷积NN(Dibyatanoy Bhattacharjee)
- 使用转移学习的Numta手写孟加拉数字分类(Hasib Zunair,Nabeel Mohammed,Sifat Momen)
- 孟加拉数字识别(Abhinav Agarwalla)
- 孟加拉数字分类(Md。AfjalHossain)
- Bocra [R包装孟加拉OCR]
- 孟加拉语OCR与CNN(Sanjiv)
- 孟加拉语手写的OCR与CNN(BM Abir
- Bangal OCR(Mehadi Hasan Menon)的合成数据生成
- 孟加拉语手写文本识别(BN-Drishti)(puc/cu,chittagong)的线条和单词细分
对文字的讲话
- Voice.bangla.gov.bd
- 孟加拉语对文字的讲话(Mehadi Hasan Menon)
TTS
- read.bangla.gov.bd
- Katha -Bangla TTS(CRBLP,BRACU)
- 孟加拉人(基于HMM的Bangla TTS)(IIT,Kharagpur)
- Apona Pathok -Bangla TTS(迷失)
- Bangla-TTS(基于CNN的深入实时(GPU)TTS)(Zabir Al Nazi)
多模式
- Bangla(Zabir Al Nazi)的剪辑(对比语言 - 图像预训练)实施
- 孟加拉模因和文本的多模式仇恨言论检测(Rezaul Karim)
其他的
- 孟加拉语咒语检查(ANKUR)
- Bangla上下文咒语检查器(Mahir Mahbub)
- 巴哈 - 私人助理(雷亚德·拉赫曼)
- 孟加拉新闻类别分类与双向LSTM(Zabir al Nazi)
- Aurthohin -Gibberish Bangla文本生成器
- Bangla Word2Vec培训和可视化(Afnan Ul Haque Nuhash)
- 使用剪辑(Zabir al Nazi)的图像搜索和图像文本匹配系统
编程langauages(?)
- Koro(去孟加拉)
- 波塔卡
- Chascript(Syed Tanveer Jishan)
- Pakhi(Shafin Ashraf)
- Pankti(Palash Bauri)
- 孟加拉语阿片
网站
- 自然语言技术研究学会
- Bracu(备份镜)的孟加拉语处理研究中心
字体
- Bangla.gov.bd
- lipighor.com