bnlp
BNLP 4.0.3
BNLP는 벵골어를위한 자연어 처리 툴킷입니다. 이 도구를 사용하면 벵골어 텍스트를 토큰 화하고 , 벵골어 단어를 포함시키고 , 벵골어 문서를 포함 , 벵골어 POS 태그 , 벵골어 이름 엔티티 인식 , 벵골어 NLP 목적을위한 방글라 텍스트 청소에 도움이됩니다.
pip install bnlp_toolkit
또는 업그레이드
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] 전체 문서는 여기에서 제공됩니다
이전 버전의 BNLP를 사용하는 경우 Documentation Archive를 확인하십시오.
자세한 내용은 Contributing.md 페이지를 확인하십시오.