Awesome-Korean-NLP
Курированный список обработки естественного языка (NLP)
- НЛП корейского текста
- Информация о НЛП, написанная на корейском языке.
Не стесняйтесь вносить свой вклад! Или Блабь это здесь
Содействие: Jeemin Sho
Индекс
- Инструменты
- Набор данных
- Блоги / слайды / исследователи
- Документы
- Лекции
- Журналы / конференции / институты / мероприятия
- Онлайн -сообщества
- Как внести свой вклад
1. Инструменты
(Корейские инструменты перечислены в преддверии языковых агентских инструментов.)
1.1. Morpheme/형태소 분석기 + часть речи (POS)/품사 Tagger
- Hannanum (한나눔) (Java, c) [ссылка]
- Kkma (꼬꼬마) (java) [ссылка] [бумага]
- Коморан (Java) [ссылка]
- Mecab-ko (C ++) [ссылка]
- Twitter (Scala, Java) [ссылка]
- Konlpy (python) [ссылка]
- .Net, node.js, Python, Ruby, Elasitc Search привязки
- DPARSER (REST API) [Ссылка]
- Utagger [ссылка]
- Ариранг (Люсинс, Ява) [Ссылка]
- Рузета [ссылка] [Слайд] [Видео]
- Seunjeon (Scala, Java) [ссылка]
- Носорог (라이노) [ссылка]
- KTS [Paper]
- 깜짝새 [ссылка]
1.2. Названный Entity (NE) Tagger / 개체명 인식기
1.3. Проверка орфографии / 맞춤법 검사기
- Проверка орфографии PNU [ссылка]
- NAVER SHEKER [Ссылка]
- DAUM SHEKER [Ссылка]
- Hunspell-ko [ссылка]
1.4. Синтаксический анализатор / 구문 분석기
- DPARSER (REST API) [Ссылка]
- NLP Hub (Java) [ссылка]
1.5. Сентиментальный анализ / 감정 분석기
- OpenHangul (오픈한글) [ссылка] [бумага]
1.6. Переводчик / 번역기
- Naver NMT [ссылка]
- Opennmt [ссылка]
- Google Translator [ссылка]
1.7. Пакеты
- Konlp (r) [ссылка]
- Konlpy (Python) [Link] [Paper]
- Koalanlp (Scala) [ссылка]
- Nltk (python) [ссылка] [бумага]
- Gensim (Python) [ссылка]
- FASTTEXT (C) [Ссылка]
- Fasttext.py (python) [ссылка]
1.8. Другие / 기타
- Hangulpy (python) [ссылка]
- Hangulize (Python) [ссылка]
- Ханджа (Python) [ссылка]
- Кроман [ссылка]
- Хангул Романизация
- Ruby, Python, Nodejs, Objective-C, Swift
- Hangul (perl) [ссылка]
- Textrankr (Python) [ссылка] [Демо]
- 한국어 word2vec [демо] [бумага]
- 한국어 Word2VEC 의 Тест аналогии 데모
- 나쁜 단어 사전 [ссылка]
- Краудсорсинга DIC о Badword на корейском языке
2. Набор данных
- Sejong Corpus [ссылка]
- Kaist Corpus [ссылка]
- Йонсеи Univ. Корпус
- Корея Univ. Корпус
- Ulsan Univ. Корпус [ссылка]
- Википедия дамп [ссылка] [экстрактор]
- Namuwiki Dump [ссылка] [экстрактор]
- Naver News Archive [ссылка]
- Chosun Archive [ссылка]
- Naver Sentiment Movie Corpus [ссылка]
- Sci-News-Sum-Kr-50 [ссылка]
3. Блоги / слайды / исследователи
3.1. Блоги
- Блог Dsindex [ссылка]
- 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [ссылка]
- Beomsu kim, "word2vec 관련 이론 정리" [ссылка]
- CPUU, «Google 자연어 오픈소스 오픈소스 SyntaxNet 공개» (корейская трансляция блога Google) [ссылка]
- TheEluwin, "Python-crfsuite 를 사용해서 한국어 자동 띄어쓰기를 학습해보자" [ссылка]
- Jaesoo lim, "한국어 형태소 분석기 동향" [ссылка]
3.2. Слайды
- Люси Парк, "한국어와 nltk, Gensim 의 만남" (Pycon APAC 2015) [ссылка]
- Jeongkyu Shin, «Создание бота в чате ИИ с использованием Python 3 & Tensorflow» (Pycon APAC 2016) [ссылка]
- Чанки Ли, «Приложение RNN & NLP» (Kangwon Univ. Курс машинного обучения) [ссылка]
- Kyunghoon Kim, "뉴스를 재미있게 만드는 방법; 뉴스잼" (Pycon APAC 2016) [ссылка]
- Hongjoo Lee, «Python 으로 19 대 국회 뽀개기» (Pycon APAC 2016) [ссылка]
- Kyumin Choi, "word2vec 이 추천시스템을 만났을 때" (Pycon APAC 2015) [ссылка]
- 進藤裕之 (перевод Hongbae Kim), «딥러닝을 이용한 자연어처리의 연구동향» [ссылка]
- Hongbae Kim, "머신러닝의 자연어 처리기술 (i)" [ссылка]
- Чанки Ли, "자연어처리를 위한 기계학습 소개" [ссылка]
- Taeil Kim, Daeneung Son, «기계 번역 모델 기반 질의 교정 시스템» (Naver Deview 2015) [ссылка]
4. Документы
4.1. корейский
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어 대화 분류를 위한 어휘 자질의 임베딩 임베딩 (2015 년 동계학술발표회 논문집)" [Paper] Ссылка мертвы
4.2. Английский
5. Лекции
5.1. Корейские лекции
- Kangwon Univ. 자연언어처리 [ссылка]
- 데이터 사이언스 스쿨 [ссылка]
- Maning Data Mining / Business Analytics [ссылка]
5.2. Английские лекции
- Стэнфорд CS224N: обработка естественного языка [ссылка] [YouTube]
- Стэнфорд CS224D: глубокое обучение для обработки естественного языка [ссылка] [YouTube]
- NLTK с Python 3 для NLP (от Sentdex) [YouTube]
- LDA Тематические модели [Ссылка]
6. Конференции / институты / мероприятия
6.1. Конференции
- 한글 및 한국어 정보처리 학술대회 [ссылка]
- Kips (한국정보처리학회) [ссылка]
- 한국음성학회 학술대회 [ссылка]
6.2. Институты
- 언어공학연구회 [ссылка]
- 한글 및 한국어 학술대회 학술대회 (с 1989 года, 매년 개최) [ссылка]
- 국어 정보 처리 경진대회 경진대회 (с 2010 года, 매년 개최, 주최: 문화체육관광부 및 국립국어원) [Ссылка]
- 자연언어처리 튜토리얼 (비정기적) [ссылка]
- 자연어처리 및 정보검색 워크샵 [ссылка]
- 한국음성학회 [ссылка]
6.3. События / конкурсы
7. Онлайн -сообщества
- Tensorflow KR (группа Facebook) [ссылка]
- AI Korea (группа Facebook) [ссылка]
- BOT Group (Facebook Group) [ссылка]
- 바벨피쉬 (Группа Facebook) [ссылка]
- Reddit Machine Learning Top Pusts [ссылка]
8. Как внести свой вклад
Вилка этого репозитория, нажав на значок «Вилка» в верхнем правом углу.
Получите ссылку для разветвленного репо, нажав на зеленую кнопку на вашей странице. Что-то вроде, "https://github.com/tranmerameзя/awesome-korean-nlp.git"
На вашей локальной машине "GIT Clone https://github.com/tusername!/awesome-korean-nlp.git"
"CD Awesome-Korean-NLP"
Откройте "readme.md" с вашим любимым текстовым редактором.
Редактировать.
git commit -a -m "Добавлен раздел 8: смайлики"
git push и проверьте свою вилку
goto https://github.com/datanada/awesome-korean-nlp и создать запрос на развлечение.
«Сравните через вилки» с базой: Datanada/Awesome .. и Head: [Имя пользователя]/Потрясающе ..
[Руководство для начинающих]