langumo ko
v0.1.4
Koleksi Parser Langumo untuk Kata Korea
langumo-ko menyediakan Parser Korea yang tersedia di Perpustakaan langumo . Saat membangun dataset menggunakan langumo , Anda dapat menggunakan berbagai data kuda menggunakan Parser yang diimplementasikan di perpustakaan itu. Kuda langumo-ko adalah sebagai berikut.
langumo_ko.NamuWikiParser : Parses file dump wiki kayu. Anda harus menggunakan file JSON asli yang termasuk dalam file dump terkompresi dalam format 7Z.langumo_ko.ModuNewsParser : Fokus pada kuda koran yang disediakan oleh kata -kata semua orang.langumo_ko.ModuWrittenParser : Parse kuda gurita yang disediakan oleh semua kuda semua orang.langumo_ko.ModuWebParser : Parse data kuda web yang disediakan oleh semua kuda semua orang. langumo-ko didistribusikan dalam repositori PYPI. Anda dapat menginstalnya sebagai berikut menggunakan pip .
$ pip install langumo-ko Alih -alih menggunakan pip , Anda dapat mengunduh repositori dan membangun dan memasangnya sendiri.
$ git clone https://github.com/affjljoo3581/langumo-ko.git
$ cd langumo-ko
$ python setup.py install Untuk membangun kuda yang tercantum di atas dengan langumo Anda dapat memodifikasi build.yml sebagai berikut:
langumo :
inputs :
- path : src/NIKL_NEWSPAPER(v1.0).zip
parser : langumo_ko.ModuNewsParser
# other configurations... Perpustakaan langumo-ko memiliki lisensi apache-2.0.