bnlp
BNLP 4.0.3
BNLP es un conjunto de herramientas de procesamiento del lenguaje natural para el lenguaje bengalí. Esta herramienta lo ayudará a tokenizar el texto bengalí , incrustar las palabras bengalíes , incrustar el documento bengalí , el etiquetado bengalí , el reconocimiento de entidades de nombre bengalí , la limpieza de texto de bangla para fines de PNLP bengalí.
pip install bnlp_toolkit
o actualizar
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] La documentación completa está disponible aquí
Si está utilizando la versión anterior de BNLP , consulte el archivo de documentación
Consulte la página de contribuyente. MD para obtener más detalles.