bnlp
BNLP 4.0.3
O BNLP é um kit de ferramentas de processamento de linguagem natural para a língua bengali. Esta ferramenta ajudará você a tokenizar o texto bengali , incorporar palavras bengalis , incorporar o documento bengali , marcação de POS bengali , reconhecimento de entidade de nomes bengali , limpeza de texto de Bangla para fins de NLP da Bengali.
pip install bnlp_toolkit
ou atualizar
pip install -U bnlp_toolkit
git clone https://github.com/sagorbrur/bnlp.git
cd bnlp
python setup.py install
from bnlp import BasicTokenizer
tokenizer = BasicTokenizer ()
raw_text = "আমি বাংলায় গান গাই।"
tokens = tokenizer ( raw_text )
print ( tokens )
# output: ["আমি", "বাংলায়", "গান", "গাই", "।"] A documentação completa está disponível aqui
Se você estiver usando a versão anterior do BNLP , verifique o arquivo de documentação
Verifique a página Contribuindo.md para obter detalhes.