Awesome-Korean-NLP
Eine kuratierte Liste der natürlichen Sprachverarbeitung (NLP) von
- NLP des koreanischen Textes
- NLP -Informationen auf Koreanisch geschrieben.
Fühlen Sie sich frei zu beitragen! oder hierher plätschern
Betreuer: Jaemin Cho
Index
- Werkzeuge
- Datensatz
- Blogs / Folien / Forscher
- Papiere
- Vorträge
- Zeitschriften / Konferenzen / Institute / Ereignisse
- Online -Communities
- Wie man beiträgt
1. Werkzeuge
(Koreanisch-spezifische Tools sind vor Sprach-Agnostischen Tools aufgeführt.)
1.1. Morphem/형태소 분석기 + Teil der Sprache (POS)/품사 Tagger
- Hannanum (한나눔) (Java, c) [Link]
- KKMA (꼬꼬마) (Java) [Link] [Papier]
- Komoran (Java) [Link]
- Mecab-ko (c ++) [Link]
- Twitter (Scala, Java) [Link]
- Konlpy (Python) [Link]
- .NET, Node.js, Python, Ruby, Elasitc -Suchbindungen
- DPARSER (REST -API) [Link]
- Utagger [Link]
- Arirang (Lucence, Java) [Link]
- Rouzeta [Link] [Folie] [Video]
- Seunjeon (Scala, Java) [Link]
- Rhino (라이노) [Link]
- KTS [Papier]
- 깜짝새 [Link]
1.2. Benannte Entity (NE) Tagger / 개체명 인식기
1.3. Zauberprüfung / 맞춤법 검사기
- PNU -Zaubersprüche [Link]
- Naver Tell Checker [Link]
- Daum Zaubersprüche [Link]
- Hunspell-ko [Link]
1.4. Syntax -Parser / 구문 분석기 분석기
- DPARSER (REST -API) [Link]
- NLP Hub (Java) [Link]
1.5. Sentimentale Analyse / 감정 분석기
- OpenHangul (오픈한글) [Link] [Papier]
1.6. Übersetzer / 번역기
- Naver NMT [Link]
- OpenNMT [Link]
- Google Übersetzer [Link]
1.7. Pakete
- Konlp (R) [Link]
- Konlpy (Python) [Link] [Papier]
- Koalanlp (Scala) [Link]
- NLTK (Python) [Link] [Papier]
- Gensim (Python) [Link]
- FastText (c) [Link]
- FastText.py (python) [Link]
1.8. Andere / 기타
- Hangulpy (Python) [Link]
- 자동 조사/접미사 첨부, 자모 분해 및 결합 결합
- Hangulize (Python) [Link]
- Hanja (Python) [Link]
- Kroman [Link]
- Hangul Romanisierung
- Ruby, Python, Nodejs, Objective-C, Swift
- Hangul (Perl) [Link]
- Textrankr (Python) [Link] [Demo]
- 한국어 WORD2VEC [Demo] [Papier]
- 한국어 Word2VEC 의 Analogie -Test 데모
- 나쁜 단어 사전 [Link]
- Crowdsourcing DIC über Badword auf Koreanisch
2. Datensatz
- Sejong Corpus [Link]
- Kaist Corpus [Link]
- Yonsei Univ. Korpus
- Korea Univ. Korpus
- Ulsan Univ. Corpus [Link]
- Wikipedia Dump [Link] [Extraktor]
- Namuwiki Dump [Link] [Extraktor]
- Naver -Nachrichtenarchiv [Link]
- Chosun Archiv [Link]
- Naver Sentiment Movie Corpus [Link]
- Sci-News-Sum-KR-50 [Link]
3.. Blogs / Folien / Forscher
3.1. Blogs
- DSIndexs Blog [Link]
- 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [Link]
- Beomsu Kim, "Word2Vec 관련 이론 정리" [Link]
- CPUU, "Google 자연어 처리 오픈소스 Syntaxnet 공개" (Korean TranlSation of Google Blog) [Link]
- Theeluwin, "Python-crfsuite 를 사용해서 한국어 띄어쓰기를 학습해보자 학습해보자" [Link]
- Jaesoo Lim, "한국어 형태소 분석기 동향" [Link]
3.2. Folien
- Lucy Park, "한국어와 nltk, Gensim 의 만남" (Pycon APAC 2015) [Link]
- Jeongkyu Shin, "AI -Chat -Bot mit Python 3 & Tensorflow" (Pycon APAC 2016) [Link]
- Changki Lee, "RNN & NLP -Anwendung" (Kangwon Univ. Maschinelles Lernen) [Link]
- Kyunghoon Kim, "뉴스를 재미있게 만드는 방법 방법; 뉴스잼" (Pycon APAC 2016) [Link]
- Hongjoo Lee, "Python 으로 19 대 국회 뽀개기" (Pycon APAC 2016) [Link]
- Kyumin Choi, "Word2Vec 이 추천시스템을 만났을 때" (Pycon APAC 2015) [Link]
- 進藤裕之 (übersetzt von Hongbae Kim), "딥러닝을 이용한 자연어처리의 연구동향" [Link]
- Hongbae Kim, "머신러닝의 자연어 처리기술 (i)" [Link]
- Changki Lee, "자연어처리를 위한 기계학습 소개 소개" [Link]
- Taeil Kim, Daeneung Sohn, "기계 번역 모델 기반 질의 교정 시스템" (Naver Deview 2015) [Link]
4. Papiere
4.1. Koreanisch
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어 대화 화행 분류를 위한 어휘 자질의 임베딩 (2015 년 논문집)" [Papier] Link tot
4.2. Englisch
5. Vorlesungen
5.1. Koreanische Vorlesungen
- Kangwon Univ. 자연언어처리 [Link]
- 데이터 사이언스 스쿨 [Link]
- SNU Data Mining / Business Analytics [Link]
5.2. Englische Vorträge
- Stanford CS224N: Verarbeitung natürlicher Sprache [Link] [YouTube]
- Stanford CS224D: Deep Learning for Natural Language Processing [Link] [YouTube]
- NLTK mit Python 3 für NLP (per Senddex) [YouTube]
- LDA -Themenmodelle [Link]
6. Konferenzen / Institute / Ereignisse
6.1. Konferenzen
- 한글 및 한국어 정보처리 학술대회 [Link]
- Kips (한국정보처리학회) [Link]
- 한국음성학회 학술대회 [Link]
6.2. Institute
- 언어공학연구회 [Link]
- 한글 및 한국어 정보처리 학술대회 (seit 1989, 매년 개최) [Link]
- 국어 정보 처리 시스템 경진대회 (seit 2010, 매년 개최 개최 주최: 문화체육관광부 및 국립국어원) [Link]
- 자연언어처리 튜토리얼 (비정기적) [Link]
- 자연어처리 및 정보검색 워크샵 [Link]
- 한국음성학회 [Link]
6.3. Ereignisse / Wettbewerbe
- 국어 정보 처리 시스템 경진 대회 [Link]
7. Online -Communities
- Tensorflow KR (Facebook -Gruppe) [Link]
- AI Korea (Facebook -Gruppe) [Link]
- Bot Group (Facebook -Gruppe) [Link]
- 바벨피쉬 (Facebook -Gruppe) [Link]
- Reddit maschinelles Lernen Top -Beiträge [Link]
8. Wie man einen Beitrag leisten
Fork dieses Repository, indem Sie auf "Fork" -Symbol in der oberen rechten Ecke klicken.
Holen Sie sich den Link für das Forked Repo, indem Sie auf die Schaltfläche Grün auf Ihrer Seite klicken. So etwas wie "https://github.com/[username weibliche/awesome-korean-nlp.git"
Auf Ihrer lokalen Maschine "Git Clone https://github.com/[username weibliche/awesome-korean-nlp.git"
"CD Awesome-Korean-NLP"
Öffnen Sie "Readme.md" mit Ihrem bevorzugten Texteditor.
Bearbeiten.
Git Commit -a -m "Hinzufügen von Abschnitt 8: Emoticons"
Git Push und überprüfen Sie auf Ihrer Gabel
goto https://github.com/datanada/awesome- korean-nlp und erstellen Sie Pull-Anfrage.
"Übergreifende Gabeln vergleiche" mit Basis: Datanada/Awesome .. und Kopf: [Benutzername]/Awesome ..
[Anfängerleitfaden]