bnlp
BNLP 4.0.3
BNLP - это инструментарий для обработки естественного языка для бенгальского языка. Этот инструмент поможет вам токенизировать бенгальский текст , внедрить бенгальские слова , внедрять бенгальский документ , бенгальское теги , бенгальское название объекта , очистка текста Bangla для бенгальских целей NLP.
pip install bnlp_toolkit
или обновление
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] Полная документация доступна здесь
Если вы используете предыдущую версию BNLP , проверьте архив документации
Проверьте Appling.md -страницу для получения подробной информации.