Awesome-corean-NLP
Uma lista com curadoria de processamento de linguagem natural (PNL) de
- NLP de texto coreano
- Informações do PNL escritos em coreano.
Sinta -se à vontade para contribuir! Ou Blab It AQUI
Manter: Jaemin Cho
Índice
- Ferramentas
- Conjunto de dados
- Blogs / slides / pesquisadores
- Papéis
- Palestras
- Revistas / conferências / institutos / eventos
- Comunidades online
- Como contribuir
1. Ferramentas
(As ferramentas específicas para coreano estão listadas antes das ferramentas agnósticas de linguagem.)
1.1. Morfema/형태소 분석기 + parte da fala (pos)/품사 tagger
- Hannanum (한나눔) (Java, C) [Link]
- Kkma (꼬꼬마 꼬꼬마) (java) [link] [papel]
- Komoran (Java) [Link]
- Mecab-ko (c ++) [link]
- Twitter (Scala, Java) [Link]
- Konlpy (Python) [Link]
- .NET, Node.JS, Python, Ruby, Elasitc Search Bindings
- DPARSER (API REST) [link]
- UTAGGER [link]
- ARIRANG (Lucence, Java) [Link]
- Rouzeta [link] [slide] [vídeo]
- Seunjeon (Scala, Java) [Link]
- Rhino (라이노) [link]
- KTS [papel]
- 깜짝새 [link]
1.2. Nomeada Entidade (NE) Tagger / 개체명 인식기
1.3. Verificador ortográfico / 맞춤법 검사기
- Verificador ortográfico da PNU [link]
- Naver Checker [Link]
- DAUM CHECTILHO DE SELHEIRO [LINK]
- hunspell-ko [link]
1.4. Sintaxe Parser / 구문 분석기 분석기
- DPARSER (API REST) [link]
- NLP Hub (Java) [Link]
1.5. Análise sentimental / 감정 분석기
- OpenHanguul (오픈한글) [link] [papel]
1.6. Tradutor / 번역기
- Naver NMT [link]
- Opennmt [link]
- Google Translator [link]
1.7. Pacotes
- Konlp (r) [link]
- Konlpy (Python) [Link] [Paper]
- Koalanlp (scala) [link]
- Nltk (python) [link] [papel]
- Gensim (Python) [Link]
- FastText (c) [link]
- Fasttext.py (python) [link]
1.8. Outros / 기타
- Hanguly (Python) [Link]
- 자동 조사/접미사 첨부, 자모 분해 및 결합 결합
- HanGulize (Python) [Link]
- Hanja (Python) [Link]
- Kroman [link]
- Romanização de Hangul
- Ruby, Python, Nodejs, Objective-C, Swift
- hanul (perl) [link]
- TexTrankr (Python) [Link] [Demo]
- 한국어 Word2vec [Demo] [Paper]
- 한국어 Word2vec 의 Teste de analogia 데모
- 나쁜 단어 사전 [link]
- Crowdsourced Dic sobre Badword em coreano
2. DataSet
- Sejong Corpus [link]
- Corpus kaist [link]
- Yonsei univ. Corpus
- Coréia Univ. Corpus
- Ulsan Univ. Corpus [link]
- Wikipedia Dump [link] [extrator]
- Namuwiki dump [link] [extrator]
- NAVER NEWS ARQUIVO [link]
- Chosun Archive [link]
- Naver Sentiment Movie Corpus [link]
- Sci-News-sum-kr-50 [link]
3. Blogs / slides / pesquisadores
3.1. Blogs
- Blog do Dsindex [link]
- 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [link]
- Beomsu kim, "word2vec 관련 이론 정리" [link]
- CPUU, "Google 자연어 오픈소스 오픈소스 Syntaxnet 공개" (Tranlsation Korean do Google Blog) [Link]
- Theeluwin, "Python-Crfsuite 를 사용해서 한국어 자동 띄어쓰기를 학습해보자" [link]
- Jaesoo Lim, "한국어 형태소 분석기 동향" [link]
3.2. Deslizamentos
- Lucy Park, "한국어와 nltk, Gensim 의 만남" (Pycon APAC 2015) [Link]
- Jeongkyu Shin, "Construindo AI Chat Bot usando Python 3 & Tensorflow" (Pycon APAC 2016) [Link]
- Changki Lee, "RNN & NLP Application" (Curso Kangwon Univ. Machine Learning) [Link]
- Kyunghoon Kim, "뉴스를 재미있게 만드는 방법; 뉴스잼" (Pycon APAC 2016) [Link]
- Hongjoo Lee, "Python 으로 19 대 국회 뽀개기 뽀개기" (Pycon APAC 2016) [Link]
- Kyumin Choi, "Word2vec 이 추천시스템을 만났을 때" (Pycon APAC 2015) [Link]
- 進藤裕之 (traduzido por Hongbae kim), "딥러닝을 이용한 자연어처리의 연구동향" [link]
- Hongbae kim, "머신러닝의 자연어 처리기술 (i)" [link]
- Changki Lee, "자연어처리를 위한 기계학습 소개" [link]
- Taeil Kim, Daeneung Son, "기계 번역 모델 기반 질의 교정 시스템" (Naver Deview 2015) [Link]
4. Documentos
4.1. coreano
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어 대화 화행 분류를 위한 어휘 자질의 임베딩 (2015 년 동계학술발표회 논문집)" [papel] link morto
4.2. Inglês
5. Palestras
5.1. Palestras coreanas
- Kangwon Univ. 자연언어처리 [link]
- 데이터 사이언스 스쿨 [link]
- SNU Mineração de dados / análise de negócios [link]
5.2. Palestras em inglês
- Stanford CS224N: Processamento de linguagem natural [Link] [YouTube]
- Stanford CS224D: Aprendizagem profunda para processamento de linguagem natural [link] [YouTube]
- NLTK com Python 3 para NLP (por SentDex) [YouTube]
- Modelos de tópicos LDA [link]
6. Conferências / Institutos / Eventos
6.1. Conferências
- 한글 및 한국어 정보처리 학술대회 [link]
- Kips (한국정보처리학회) [link]
- 한국음성학회 학술대회 [link]
6.2. Institutos
- 언어공학연구회 [link]
- 한글 및 한국어 정보처리 학술대회 (desde 1989, 매년 개최) [link]
- 국어 정보 처리 시스템 경진대회 (desde 2010, 매년 개최, 주최: 문화체육관광부 및 국립국어원) [link]
- 자연언어처리 튜토리얼 (비정기적) [link]
- 자연어처리 및 정보검색 워크샵 [link]
- 한국음성학회 [link]
6.3. Eventos / concursos
- 국어 정보 처리 시스템 경진 대회 [link]
7. Comunidades on -line
- Tensorflow KR (Grupo do Facebook) [Link]
- AI Coréia (Grupo do Facebook) [Link]
- Bot Group (Grupo do Facebook) [Link]
- 바벨피쉬 (Grupo do Facebook) [Link]
- Reddit Machine Learning Postagens principais [link]
8. Como contribuir
Garra este repositório, clicando no ícone "Fork" no canto superior direito.
Obtenha o link para o repositório bifurcado, clicando no botão verde na sua página. Algo como "https://github.com/ponusername ]/weome-korean-nlp.git"
Em sua máquina local, "Git clone https://github.com/ponusername ]/awesome-korean-nlp.git"
"CD Awesome-corean-NLP"
Abra "Readme.md" com seu editor de texto favorito.
Editar.
Git Commit -a -m "Adicionada seção 8: emoticons"
git push e verifique no seu garfo
GOTO https://github.com/datanada/awesome-korean-nlp e crie uma solicitação de tração.
"Compare através dos garfos" com a base: DataNada/Awesome .. e cabeça: [nome de usuário]/incrível ..
[Guia para iniciantes]