Luar biasa-Korean-NLP
Daftar Pemrosesan Bahasa Alami (NLP) yang dikuratori
- NLP teks Korea
- Informasi NLP ditulis dalam bahasa Korea.
Jangan ragu untuk berkontribusi! atau mengoceh di sini
Pemelihara: Jaemin Cho
Indeks
- Peralatan
- Dataset
- Blog / slide / peneliti
- Dokumen
- Ceramah
- Jurnal / Konferensi / Lembaga / Acara
- Komunitas online
- Bagaimana berkontribusi
1. Alat
(Alat khusus Korea tercantum di depan alat agnostik bahasa.)
1.1. Morfem/형태소 분석기 + Bagian dari Pidato (POS)/품사 Tagger
- Hannanum (한나눔) (java, c) [tautan]
- Kkma (꼬꼬마) (java) [tautan] [kertas]
- Komoran (Java) [tautan]
- Mecab-ko (c ++) [tautan]
- Twitter (Scala, Java) [tautan]
- Konlpy (Python) [tautan]
- .Net, node.js, python, ruby, binding pencarian elasitc
- dparser (REST API) [tautan]
- Utagger [tautan]
- Arirang (Lucence, Java) [tautan]
- Rouzeta [link] [slide] [video]
- Seunjeon (Scala, Java) [tautan]
- Rhino (라이노) [tautan]
- KTS [kertas]
- 깜짝새 [tautan]
1.2. Named Entity (NE) Tagger / 개체명 인식기
1.3. Pemeriksa ejaan / 맞춤법 검사기
- Pemeriksa Ejaan PNU [tautan]
- Pemeriksa Ejaan Naver [tautan]
- Daum Ejaan Pemeriksa [Tautan]
- hunspell-ko [tautan]
1.4. Sintaks parser / 구문 분석기
- dparser (REST API) [tautan]
- Hub NLP (Java) [tautan]
1.5. Analisis sentimental / 감정 분석기
- OpenHangul (오픈한글) [tautan] [kertas]
1.6. Penerjemah / 번역기
- NAVER NMT [tautan]
- Opennmt [tautan]
- Penerjemah Google [tautan]
1.7. Paket
- Konlp (r) [tautan]
- Konlpy (python) [tautan] [kertas]
- Koalanlp (scala) [tautan]
- Nltk (python) [tautan] [kertas]
- gensim (python) [tautan]
- Fasttext (c) [tautan]
- Fasttext.py (python) [tautan]
1.8. Orang lain / 기타
- Hangulpy (python) [tautan]
- Hangulize (Python) [tautan]
- Hanja (Python) [tautan]
- Kroman [tautan]
- Hangul Romanisasi
- Ruby, Python, Nodejs, Objective-C, Swift
- Hangul (Perl) [tautan]
- Textrankr (Python) [Link] [Demo]
- 한국어 Word2vec [demo] [kertas]
- 한국어 tes analogi word2vec 의 데모
- 나쁜 단어 사전 [tautan]
- crowdsourced DIC tentang Badword dalam bahasa Korea
2. Dataset
- Sejong Corpus [tautan]
- Kaist Corpus [tautan]
- Yonsei Univ. Corpus
- Korea Univ. Corpus
- Ulsan Univ. Corpus [tautan]
- Wikipedia dump [tautan] [ekstraktor]
- Namuwiki dump [tautan] [ekstraktor]
- Naver News Archive [tautan]
- Chosun Archive [Link]
- Naver Sentiment Movie Corpus [tautan]
- Sci-news-sum-kr-50 [tautan]
3. Blog / Slide / Peneliti
3.1. Blog
- Blog DSIndex [tautan]
- 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [tautan]
- Beomsu Kim, "Word2Vec 관련 이론 정리" [tautan]
- CPUU, "Google 자연어 처리 오픈소스 Sintaksnet 공개" (Tranlsation dari Google Blog Korea) [tautan]
- Theeluwin, "Python-Crfsuite 를 사용해서 한국어 자동 띄어쓰기를 학습해보자" [tautan]
- Jaesoo lim, "한국어 형태소 분석기 동향" [tautan]
3.2. Slide
- Lucy Park, "한국어와 NLTK, Gensim 의 만남" (Pycon APAC 2015) [Link]
- Jeongkyu Shin, "Building AI Chat Bot Menggunakan Python 3 & TensorFlow" (Pycon APAC 2016) [Tautan]
- Changki Lee, "Aplikasi RNN & NLP" (Kursus Pembelajaran Mesin Kangwon) [Tautan]
- Kyunghoon Kim, "뉴스를 재미있게 만드는; 뉴스잼" (Pycon APAC 2016) [tautan]
- Hongjoo Lee, "Python 으로 19 대 국회 뽀개기" (Pycon APAC 2016) [tautan]
- Kyumin Choi, "Word2Vec 이 추천시스템을 만났을 때" (Pycon APAC 2015) [tautan]
- 進藤裕之 (diterjemahkan oleh hongbae kim), "딥러닝을 이용한 자연어처리의 연구동향" [tautan]
- Hongbae Kim, "머신러닝의 자연어 처리기술 (i)" [tautan]
- Changki Lee, "자연어처리를 위한 기계학습 소개" [tautan]
- Taeil Kim, putra Daeneung, "기계 번역 모델 기반 질의 교정 시스템" (Naver Deview 2015) [tautan]
4. Makalah
4.1. Korea
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어 대화 화행 분류를 위한 어휘 자질의 임베딩 임베딩 임베딩 임베딩 년 동계학술발표회 논문집 논문집 논문집 논문집 논문집 논문집 논문집 분류를 위한 어휘 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집 논문집) tautan mati
4.2. Bahasa inggris
5. Ceramah
5.1. Ceramah Korea
- Kangwon Univ. 자연언어처리 [tautan]
- 데이터 사이언스 스쿨 [tautan]
- SNU Data Mining / Business Analytics [Link]
5.2. Ceramah Bahasa Inggris
- Stanford CS224N: Pemrosesan Bahasa Alami [tautan] [YouTube]
- Stanford CS224D: Pembelajaran mendalam untuk pemrosesan bahasa alami [tautan] [YouTube]
- NLTK dengan Python 3 untuk NLP (oleh SentDex) [YouTube]
- Model Topik LDA [tautan]
6. Konferensi / Lembaga / Acara
6.1. Konferensi
- 한글 및 한국어 정보처리 학술대회 [tautan]
- Kips (한국정보처리학회) [tautan]
- 한국음성학회 학술대회 [tautan]
6.2. Lembaga
- 언어공학연구회 [tautan]
- 한글 및 한국어 정보처리 학술대회 (sejak 1989, 매년 개최) [tautan]
- 국어 정보 처리 시스템 경진대회 (sejak 2010, 매년 개최, 주최: 문화체육관광부 및 국립국어원) [tautan]
- 자연언어처리 튜토리얼 (비정기적) [tautan]
- 자연어처리 및 정보검색 워크샵 [tautan]
- 한국음성학회 [tautan]
6.3. Acara / Kontes
- 국어 정보 처리 시스템 경진 대회 [tautan]
7. Komunitas online
- TensorFlow KR (grup Facebook) [tautan]
- AI Korea (grup Facebook) [tautan]
- Bot Group (Facebook Group) [tautan]
- 바벨피쉬 (grup Facebook) [tautan]
- Reddit Machine Learning Posting teratas [tautan]
8. Cara berkontribusi
Fork Repositori ini, dengan mengklik ikon "Fork" di sudut kanan atas.
Dapatkan tautan untuk repo forked, dengan mengklik tombol hijau di halaman Anda. Sesuatu seperti, "https://github.com/htusername Nama/awesome-korean-nlp.git"
Di mesin lokal Anda, "Git Clone https://github.com/htusernameace/awesome-korean-nlp.git"
"CD Awesome-Korean-NLP"
Buka "ReadMe.MD" dengan editor teks favorit Anda.
Edit.
Git Commit -A -M "Ditambahkan Bagian 8: Emotikon"
dorongan git, dan verifikasi di garpu Anda
goto https://github.com/datanada/awese-korean-nlp dan buat permintaan tarik.
"Bandingkan Across Forks" dengan Base: Datanada/Awesome .. dan Head: [Username]/Awesome ..
[Panduan Pemula]