langumo ko
v0.1.4
Коллекция парсера Langumo для корейских слов
langumo-ko предоставляет корейский Parser , доступный в библиотеке langumo . При создании набора данных с использованием langumo вы можете просто использовать различные данные лошадей, используя Parser , реализованный в этой библиотеке. Лошади langumo-ko следующие.
langumo_ko.NamuWikiParser : анализирует деревянный файл дампы вики. Вы должны использовать исходный файл JSON, включенный в файл сжатого дампа в формате 7Z.langumo_ko.ModuNewsParser : сосредоточиться на газетных лошадях, предоставленных словами каждого.langumo_ko.ModuWrittenParser : анализ осьминог, предоставленных всеми лошадьми.langumo_ko.ModuWebParser : анализ данных веб -лошадей, предоставленных всеми лошадьми. langumo-ko распределяется в репозитории PYPI. Вы можете установить его следующим образом, используя pip .
$ pip install langumo-ko Вместо использования pip вы можете загрузить репозиторий, создать и установить его самостоятельно.
$ git clone https://github.com/affjljoo3581/langumo-ko.git
$ cd langumo-ko
$ python setup.py install Чтобы построить лошадей, перечисленных выше с langumo вы можете изменить build.yml следующим образом:
langumo :
inputs :
- path : src/NIKL_NEWSPAPER(v1.0).zip
parser : langumo_ko.ModuNewsParser
# other configurations... Библиотека langumo-ko имеет лицензию Apache-2.0.