bnlp
BNLP 4.0.3
BNLPは、ベンガル語の自然言語処理ツールキットです。このツールは、ベンガル語のテキストのトークン、ベンガル語の単語の埋め込み、ベンガル語の文書の埋め込み、ベンガル語のPOSタグ付け、ベンガル語名のエンティティ認識、ベンガル語のNLPの目的のためのバングラテキストクリーニングに役立ちます。
pip install bnlp_toolkit
またはアップグレード
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] 完全なドキュメントはこちらから入手できます
BNLPの以前のバージョンを使用している場合は、ドキュメントアーカイブを確認してください
詳細については、Contributing.MDページを確認してください。