langumo ko
v0.1.4
langumo parser系列韓語單詞
langumo-ko提供韓國Parser ,可在langumo圖書館提供。使用langumo構建數據集時,您可以簡單地使用該庫中實現的Parser使用各種馬數據。 langumo-ko的馬如下。
langumo_ko.NamuWikiParser :解析木製Wiki轉儲文件。您必須使用7Z格式的壓縮轉儲文件中包含的原始JSON文件。langumo_ko.ModuNewsParser :專注於每個人所提供的報紙馬。langumo_ko.ModuWrittenParser :解析所有每個人都提供的章魚馬。langumo_ko.ModuWebParser :解析所有每個人都提供的網絡馬數據。 langumo-ko分佈在PYPI存儲庫中。您可以使用pip按照以下方式安裝它。
$ pip install langumo-ko您可以下載存儲庫並自己構建和安裝,而不是使用pip 。
$ git clone https://github.com/affjljoo3581/langumo-ko.git
$ cd langumo-ko
$ python setup.py install要構建上面使用langumo您可以修改build.yml ,如下所示:
langumo :
inputs :
- path : src/NIKL_NEWSPAPER(v1.0).zip
parser : langumo_ko.ModuNewsParser
# other configurations... langumo-ko庫具有Apache-2.0許可證。