bnlp
BNLP 4.0.3
BNLP est une boîte à outils de traitement du langage naturel pour la langue bengali. Cet outil vous aidera à tokensiner le texte bengali , à intégrer des mots bengali , à intégrer un document bengali , un étiquetage de POS bengali , une reconnaissance de l'entité de nom bengali , un nettoyage de texte bangla à des fins de NLP bengali.
pip install bnlp_toolkit
ou mettre à niveau
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] Une documentation complète est disponible ici
Si vous utilisez la version précédente de BNLP, vérifiez l'archive de documentation
Vérifiez la page contribution.md pour plus de détails.