bnlp
BNLP 4.0.3
BNLP是孟加拉语语言的自然语言处理工具包。此工具将帮助您示意孟加拉文本,嵌入孟加拉语单词,嵌入孟加拉文档,孟加拉语POS标签,孟加拉语名称实体识别,孟加拉文本清洁孟加拉语NLP目的。
pip install bnlp_toolkit
或升级
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] 完整的文档可在此处提供
如果您使用的是BNLP的先前版本,请检查文档存档
查看贡献。MD页面以获取详细信息。