Génial-korean-nlp
Une liste organisée de traitement du langage naturel (PNL) de
- PNL du texte coréen
- Informations PNL écrites en coréen.
N'hésitez pas à contribuer! ou blab ici
HEUPTENER: Jaemin Cho
Indice
- Outils
- Ensemble de données
- Blogs / diapositives / chercheurs
- Papiers
- Conférences
- Journaux / conférences / instituts / événements
- Communautés en ligne
- Comment contribuer
1. Outils
(Les outils spécifiques aux coréens sont répertoriés avant les outils agnostiques du langage.)
1.1. Morphème / 형태소 분석기 + partie de la parole (POS) / 품사 Tagger
- Hannanum (한나눔) (java, c) [lien]
- Kkma (꼬꼬마) (java) [lien] [papier]
- Komoran (Java) [lien]
- MECAB-KO (C ++) [lien]
- Twitter (Scala, Java) [lien]
- Konlpy (python) [lien]
- .Net, node.js, python, ruby, liaisons de recherche Elasitc
- DPARSER (API REST) [lien]
- Utagger [lien]
- ARIRANG (LUCENCE, Java) [Lien]
- Rouzeta [lien] [Slide] [VIDEO]
- Seunjeon (Scala, Java) [lien]
- Rhino (라이노) [lien]
- KTS [papier]
- 깜짝새 [lien]
1.2. Entité nommée (NE) Tagger / 개체명 인식기
1.3. Vérificateur orthographique / 맞춤법 검사기
- PNU Spell Checker [lien]
- Naver Spell Checker [lien]
- Daum Spell Checker [lien]
- Hunspell-ko [lien]
1.4. Parser syntaxe / 구문 분석기
- DPARSER (API REST) [lien]
- NLP Hub (Java) [lien]
1.5. Analyse sentimentale / 감정 분석기
- OpenHangul (오픈한글) [lien] [papier]
1.6. Traducteur / 번역기
- Naver nmt [lien]
- Opennmt [lien]
- Traducteur Google [lien]
1.7. Packages
- Konlp (r) [lien]
- Konlpy (python) [lien] [papier]
- Koalanlp (scala) [lien]
- Nltk (python) [lien] [papier]
- gensim (python) [lien]
- FastText (C) [lien]
- FastText.py (python) [lien]
1.8. Autres / 기타
- Hangulpy (python) [lien]
- 자동 조사 / 접미사 첨부, 자모 분해 및 및 결합
- Hanguliser (python) [lien]
- Hanja (python) [lien]
- Kroman [lien]
- Hangul Romanisation
- Ruby, Python, Nodejs, Objective-C, Swift
- hangul (perl) [lien]
- Textrankr (Python) [lien] [Demo]
- 한국어 word2vec [démo] [papier]
- 한국어 Word2Vec 의 Test d'analogie 데모
- 나쁜 단어 사전 [lien]
- Crowdsourced dic sur la mauvaise mots en coréen
2. ensemble de données
- Sejong Corpus [lien]
- Kaist Corpus [lien]
- Yonsei Univ. Corpus
- Corée Univ. Corpus
- Ulsan Univ. Corpus [lien]
- Wikipedia Dump [lien] [Extracteur]
- Dump namuwiki [lien] [Extracteur]
- Archive de nouvelles Naver [Lien]
- Chosun Archive [lien]
- Naver Sentiment Movie Corpus [lien]
- Sci-news-Sum-Kr-50 [lien]
3. blogs / diapositives / chercheurs
3.1. Blogs
- Blog de Dsindex [lien]
- 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [lien]
- Beomsu Kim, "Word2Vec 관련 이론 정리" [lien]
- CPUU, "Google 자연어 처리 오픈소스 Syntaxnet 공개" (TranlSation coréenne de Google Blog) [Lien]
- TheEluwin, "Python-CrfSuite 를 사용해서 한국어 자동 띄어쓰기를 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자 학습해보자" [lien]
- Jaesoo Lim, "한국어 형태소 분석기 동향" [lien]
3.2. Diapositives
- Lucy Park, "한국어와 NLTK, Gensim 의 만남" (Pycon APAC 2015) [Lien]
- Jeongkyu Shin, "Building AI Chat Bot en utilisant Python 3 & TensorFlow" (Pycon APAC 2016) [Lien]
- Changki Lee, "RNN & NLP Application" (Kangwon Univ. Machine Learning Course) [Lien]
- Kyunghoon Kim, "뉴스를 재미있게 만드는 방법; 뉴스잼" (Pycon APAC 2016) [Lien]
- Hongjoo Lee, "Python 으로 19 대 국회 뽀개기" (Pycon apac 2016) [lien]
- Kyumin Choi, "Word2Vec 이 추천시스템을 만났을 때" (Pycon APAC 2015) [Lien]
- 進藤裕之 (traduit par Hongbae Kim), "딥러닝을 이용한 자연어처리의 연구동향" [lien]
- Hongbae Kim, "머신러닝의 자연어 처리기술 (i)" [lien]
- Changki Lee, "자연어처리를 위한 기계학습 소개" [lien]
- Taeil Kim, Daeneung Son, "기계 번역 모델 기반 질의 교정 시스템 시스템" (Naver Deview 2015) [lien]
4. Papiers
4.1. coréen
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어 대화 화행 분류를 위한 어휘 어휘 자질의 (2015 년 동계학술발표회 논문집)" [papier] lier les morts
4.2. Anglais
5. Conférences
5.1. Conférences coréennes
- Kangwon Univ. 자연언어처리 [lien]
- 데이터 사이언스 스쿨 [lien]
- SNU Data Mining / Business Analytics [Lien]
5.2. Conférences anglaises
- Stanford CS224N: Traitement du langage naturel [Lien] [YouTube]
- Stanford CS224D: Deep Learning for Natural Language Traitement [Lien] [YouTube]
- NLTK avec Python 3 pour NLP (par Senddex) [YouTube]
- Modèles de sujet LDA [lien]
6. Conférences / instituts / événements
6.1. Conférences
- 한글 및 한국어 정보처리 학술대회 [lien]
- Kips (한국정보처리학회) [lien]
- 한국음성학회 학술대회 [lien]
6.2. Instituts
- 언어공학연구회 [lien]
- 한글 및 한국어 정보처리 학술대회 (depuis 1989, 매년 개최) [lien]
- 국어 정보 처리 시스템 경진대회 (depuis 2010, 매년 개최, 주최: 문화체육관광부 및 국립국어원) [lien]
- 자연언어처리 튜토리얼 (비정기적) [lien]
- 자연어처리 및 정보검색 워크샵 [lien]
- 한국음성학회 [lien]
6.3. Événements / concours
- 국어 정보 처리 시스템 경진 대회 [lien]
7. Communautés en ligne
- Tensorflow KR (groupe Facebook) [lien]
- AI Korea (groupe Facebook) [lien]
- Groupe de robots (groupe Facebook) [lien]
- 바벨피쉬 (groupe Facebook) [lien]
- Reddit Machine Learning Top Posts [lien]
8. Comment contribuer
Fourk ce référentiel, en cliquant sur l'icône "Fork" dans le coin supérieur droit.
Obtenez le lien pour le dépôt fourchu en cliquant sur le bouton vert de votre page. Quelque chose comme, "https://github.com/[Username
Sur votre machine locale, "Git Clone https://github.com/[USERNAME DAGE/AWESEM-KOREAN-NLP.git"
"CD génial-korean-nlp"
Ouvrez "Readme.md" avec votre éditeur de texte préféré.
Modifier.
git commit -a -m "Ajout de la section 8: émoticônes"
Git pousse et vérifiez votre fourchette
Goto https://github.com/datanada/awesome-korean-nlp et créez une demande de traction.
"Comparez à travers les fourks" avec la base: datanada / génial .. et tête: [nom d'utilisateur] / génial ..
[Guide des débutants]