langumo ko
v0.1.4
韓国語のためのランゴモパーサーコレクション
langumo-ko langumo Libraryで韓国のParserを提供しています。 langumoを使用してデータセットを構築する場合、そのライブラリに実装されたParserを使用して、さまざまな馬のデータを使用するだけです。 langumo-koの馬は次のとおりです。
langumo_ko.NamuWikiParser :木製のウィキダンプファイルを解析します。 7Z形式の圧縮ダンプファイルに含まれる元のJSONファイルを使用する必要があります。langumo_ko.ModuNewsParser :みんなの言葉が提供する新聞の馬に焦点を当てます。langumo_ko.ModuWrittenParser :すべての人の馬が提供するタコ馬を解析します。langumo_ko.ModuWebParser :すべての人の馬が提供するWeb馬のデータを解析します。 langumo-koはPypiリポジトリに配布されています。 pipを使用して次のようにインストールできます。
$ pip install langumo-kopipを使用する代わりに、リポジトリをダウンロードして、自分でビルドしてインストールできます。
$ git clone https://github.com/affjljoo3581/langumo-ko.git
$ cd langumo-ko
$ python setup.py install上記のlangumo次のようにbuild.yml変更できます。
langumo :
inputs :
- path : src/NIKL_NEWSPAPER(v1.0).zip
parser : langumo_ko.ModuNewsParser
# other configurations... langumo-koライブラリには、Apache-2.0ライセンスがあります。