Impresionante-coreano-NLP
Una lista curada de procesamiento del lenguaje natural (PNL) de
- PNL de texto coreano
- Información de la PNL escrita en coreano.
¡Siéntete libre de contribuir! o dármelo aquí
Mantenedor: Jaemin Cho
Índice
- Herramientas
- Conjunto de datos
- Blogs / diapositivas / investigadores
- Papeles
- Conferencias
- Revistas / conferencias / institutos / eventos
- Comunidades en línea
- Cómo contribuir
1. Herramientas
(Las herramientas específicas de Corea se enumeran por delante de las herramientas agnósticas del lenguaje).
1.1. Morfema/형태소 분석기 + parte del discurso (pos)/품사 tagger
- Hannanum (한나눔) (Java, C) [enlace]
- KKMA (꼬꼬마) (Java) [Enlace] [Paper]
- Komoran (Java) [enlace]
- Mecab-ko (c ++) [enlace]
- Twitter (Scala, Java) [enlace]
- Konlpy (Python) [enlace]
- .NET, Node.js, Python, Ruby, Bindings de búsqueda ELASITC
- DPARSER (REST API) [enlace]
- Utagger [enlace]
- Arirang (Lucence, Java) [enlace]
- Rouzeta [enlace] [diapositiva] [video]
- Seunjeon (Scala, Java) [enlace]
- Rhino (라이노) [enlace]
- KTS [papel]
- 깜짝새 [Enlace]
1.2. Entidad nombrada (NE) Tagger / 개체명 인식기 인식기 인식기 인식기 인식기 인식기 인식기 인식기 인식기 인식기 인식기 인식기
1.3. Corredor de ortografía / 맞춤법 검사기 검사기 검사기 검사기 검사기 검사기
- Resplante de ortografía de PNU [enlace]
- Camplante de ortografía de Naver [enlace]
- Daum Spell Campler [Enlace]
- hunspell-ko [enlace]
1.4. Sintaxis analizador / 구문 분석기 분석기 분석기 분석기 분석기 분석기
- DPARSER (REST API) [enlace]
- NLP Hub (Java) [enlace]
1.5. Análisis sentimental / 감정 분석기
- Openhangul (오픈한글) [enlace] [papel]
1.6. Traductor / 번역기
- Naver NMT [enlace]
- OpenNMT [enlace]
- Traductor de Google [enlace]
1.7. Paquetes
- Konlp (r) [enlace]
- Konlpy (Python) [enlace] [Paper]
- Koalanlp (Scala) [enlace]
- Nltk (python) [enlace] [papel]
- Gensim (Python) [enlace]
- FastText (c) [enlace]
- FastText.py (Python) [enlace]
1.8. Otros / 기타
- Hangulpy (Python) [enlace]
- Hangulize (Python) [enlace]
- Hanja (Python) [enlace]
- Kroman [enlace]
- Romanización por hangul
- Ruby, Python, NodeJs, Objective-C, Swift
- Hangul (Perl) [Enlace]
- Textrankr (Python) [enlace] [demostración]
- 한국어 word2vec [demo] [papel]
- 한국어 word2vec 의 prueba de analogía 데모
- 나쁜 단어 사전 [enlace]
- Dic de crowdsourced sobre palabras malas en coreano
2. Conjunto de datos
- Sejong Corpus [enlace]
- Kaist Corpus [enlace]
- Yonsei Univ. Cuerpo
- Corea Univ. Cuerpo
- Ulsan Univ. Corpus [enlace]
- Volcado de Wikipedia [enlace] [extractor]
- Namuwiki ver [enlace] [extractor]
- Archivo de Naver News [enlace]
- Archivo de Chosun [enlace]
- Naver Sentiment Movie Corpus [enlace]
- Sci-News-Sum-Kr-50 [enlace]
3. Blogs / diapositivas / investigadores
3.1. Blogs
- Blog de Dsindex [enlace]
- 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [enlace]
- Beomsu Kim, "Word2Vec 관련 이론 정리" [enlace]
- CPUU, "Google 자연어 처리 오픈소스 Syntaxnet 공개" (Blog de Tranlsación Coreana del Blog de Google) [Enlace]
- Theeluwin, "Python-Crfsuite 를 사용해서 한국어 자동 띄어쓰기를 학습해보자" [Link]
- Jaesoo Lim, "한국어 형태소 분석기 동향" [enlace]
3.2. Toboganes
- Lucy Park, "한국어와 한국어와 nltk, Gensim 의 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 만남 uct eléctrica eléctrica) [enlace]
- Jeongkyu Shin, "Building Ai Chat Bot usando Python 3 y Tensorflow" (Pycon APAC 2016) [Enlace]
- Changki Lee, "Aplicación RNN & NLP" (Kangwon Univ. Machine Learning Course) [Enlace]
- Kyunghoon Kim, "뉴스를 재미있게 만드는 방법 방법 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼 뉴스잼” ””
- Hongjoo Lee, "Python 으로 19 대 국회 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기 뽀개기” ”
- Kyumin Choi, "Word2Vec 이 추천시스템을 만났을 때 때" (Pycon APAC 2015) [Enlace]
- 進藤裕之 (traducido por Hongbae Kim), "딥러닝을 이용한 자연어처리의 연구동향" [enlace]
- Hongbae Kim, "머신러닝의 자연어 처리기술 (i)" [Enlace]
- Changki Lee, "자연어처리를 위한 기계학습 소개" [enlace]
- Taeil Kim, Daeneung hijo, "기계 번역 모델 기반 질의 교정 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 시스템 교정 교정 시스템 교정 교정 교정 교정 시스템 eléctrica eléctrica) [enlace]
4. Documentos
4.1. coreano
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어 대화 화행 분류를 위한 어휘 자질의 임베딩 (2015 년 동계학술발표회 논문집)" [Paper] Enlace muerto
4.2. Inglés
5. Conferencias
5.1. Conferencias coreanas
- Kangwon Univ. 자연언어처리 [Enlace]
- 데이터 사이언스 스쿨 [enlace]
- SNU Data Mining / Business Analytics [Enlace]
5.2. Conferencias en inglés
- Stanford CS224N: Procesamiento del lenguaje natural [enlace] [YouTube]
- Stanford CS224D: Aprendizaje profundo para el procesamiento del lenguaje natural [enlace] [YouTube]
- NLTK con Python 3 para NLP (por Sentdex) [YouTube]
- Modelos de temas de LDA [enlace]
6. Conferencias / Institutos / Eventos
6.1. Conferencias
- 한글 및 한국어 정보처리 학술대회 [enlace]
- Kips (한국정보처리학회) [enlace]
- 한국음성학회 학술대회 [enlace]
6.2. Institutos
- 언어공학연구회 [Enlace]
- 한글 및 한국어 정보처리 학술대회 (desde 1989, 매년 개최) [enlace]
- 국어 정보 처리 시스템 경진대회 (desde 2010, 매년 개최 개최, 주최: 문화체육관광부 및 국립국어원) [enlace]
- 자연언어처리 튜토리얼 (비정기적) [enlace]
- 자연어처리 및 정보검색 워크샵 [enlace]
- 한국음성학회 [Enlace]
6.3. Eventos / concursos
- 국어 정보 처리 시스템 경진 대회 [enlace]
7. Comunidades en línea
- Tensorflow KR (grupo de Facebook) [enlace]
- AI Corea (Grupo de Facebook) [Enlace]
- Bot Group (Grupo de Facebook) [Enlace]
- 바벨피쉬 (grupo de Facebook) [enlace]
- Reddit Machine Learning Top Publics [Enlace]
8. Cómo contribuir
Bifurca este repositorio, haciendo clic en el icono de "bifurcación" en la esquina superior derecha.
Obtenga el enlace para el repositorio bifurcado, haciendo clic en el botón verde en su página. Algo así como "https://github.com/•usernamefont>/awesome-korean-nlp.git"
En su máquina local, "Git Clone https://github.com/•usernamefont>/awesome-korean-nlp.git"
"CD Awesome-Korean-NP"
Abra "ReadMe.md" con su editor de texto favorito.
Editar.
git commit -a -m "agregó la sección 8: emoticones"
Git empuje y verifique en su horquilla
GOTO https://github.com/datanada/awesome-korean-nlp y crea solicitud de extracción.
"Compare a través de las horquillas" con la base: DataNada/Awesome .. y Head: [Nombre de usuario]/Awesome ..
[Guía para principiantes]