langumo ko
v0.1.4
langumo parser系列韩语单词
langumo-ko提供韩国Parser ,可在langumo图书馆提供。使用langumo构建数据集时,您可以简单地使用该库中实现的Parser使用各种马数据。 langumo-ko的马如下。
langumo_ko.NamuWikiParser :解析木制Wiki转储文件。您必须使用7Z格式的压缩转储文件中包含的原始JSON文件。langumo_ko.ModuNewsParser :专注于每个人所提供的报纸马。langumo_ko.ModuWrittenParser :解析所有每个人都提供的章鱼马。langumo_ko.ModuWebParser :解析所有每个人都提供的网络马数据。 langumo-ko分布在PYPI存储库中。您可以使用pip按照以下方式安装它。
$ pip install langumo-ko您可以下载存储库并自己构建和安装,而不是使用pip 。
$ git clone https://github.com/affjljoo3581/langumo-ko.git
$ cd langumo-ko
$ python setup.py install要构建上面使用langumo您可以修改build.yml ,如下所示:
langumo :
inputs :
- path : src/NIKL_NEWSPAPER(v1.0).zip
parser : langumo_ko.ModuNewsParser
# other configurations... langumo-ko库具有Apache-2.0许可证。