langumo ko
v0.1.4
Colección de analizador de langumo para palabras coreanas
langumo-ko proporciona Parser coreano disponible en la Biblioteca langumo . Al construir un conjunto de datos con langumo , simplemente puede usar varios datos de caballos utilizando Parser implementado en esa biblioteca. Los caballos de langumo-ko son los siguientes.
langumo_ko.NamuWikiParser : analiza el archivo de volcado wiki de madera. Debe usar el archivo JSON original incluido en el archivo de volcado comprimido en el formato 7Z.langumo_ko.ModuNewsParser : concéntrese en los caballos de los periódicos proporcionados por las palabras de todos.langumo_ko.ModuWrittenParser : analizar los caballos de pulpo proporcionados por todos los caballos de todos.langumo_ko.ModuWebParser : analizar los datos del caballo web proporcionados por todos los caballos de todos. langumo-ko se distribuye en el repositorio de Pypi. Puede instalarlo de la siguiente manera usando pip .
$ pip install langumo-ko En lugar de usar pip , puede descargar el repositorio y construirlo e instalarlo usted mismo.
$ git clone https://github.com/affjljoo3581/langumo-ko.git
$ cd langumo-ko
$ python setup.py install Para construir los caballos enumerados anteriormente con langumo puede modificar build.yml de la siguiente manera:
langumo :
inputs :
- path : src/NIKL_NEWSPAPER(v1.0).zip
parser : langumo_ko.ModuNewsParser
# other configurations... langumo-ko tiene una licencia Apache-2.0.