bnlp
BNLP 4.0.3
BNLP adalah alat pemrosesan bahasa alami untuk bahasa Bengali. Alat ini akan membantu Anda untuk tokenisasi teks Bengali , menyematkan kata -kata Bengali , menyematkan dokumen Bengali , penandaan Pos Bengali , pengenalan entitas nama Bengali , pembersihan teks Bangla untuk keperluan NLP Bengali.
pip install bnlp_toolkit
atau upgrade
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] Dokumentasi lengkap tersedia di sini
Jika Anda menggunakan versi BNLP sebelumnya, periksa arsip dokumentasi
Periksa halaman Contributing.md untuk detailnya.