bnlp
BNLP 4.0.3
BNLP是孟加拉語語言的自然語言處理工具包。此工具將幫助您示意孟加拉文本,嵌入孟加拉語單詞,嵌入孟加拉文檔,孟加拉語POS標籤,孟加拉語名稱實體識別,孟加拉文本清潔孟加拉語NLP目的。
pip install bnlp_toolkit
或升級
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] 完整的文檔可在此處提供
如果您使用的是BNLP的先前版本,請檢查文檔存檔
查看貢獻。 MD頁面以獲取詳細信息。