น่ากลัว-เกาหลี-NLP
รายการการประมวลผลภาษาธรรมชาติ (NLP) ของรายการ
- NLP ของข้อความเกาหลี
- ข้อมูล NLP ที่เขียนเป็นภาษาเกาหลี
อย่าลังเลที่จะมีส่วนร่วม! หรือพูดจาโผงผางที่นี่
ผู้ดูแล: Jaemin Cho
ดัชนี
- เครื่องมือ
- ชุดข้อมูล
- บล็อก / สไลด์ / นักวิจัย
- เอกสาร
- การบรรยาย
- วารสาร / การประชุม / สถาบัน / กิจกรรม
- ชุมชนออนไลน์
- วิธีการมีส่วนร่วม
1. เครื่องมือ
(เครื่องมือเฉพาะเกาหลีอยู่ในรายการก่อนเครื่องมือที่ไม่เชื่อเรื่องภาษา)
1.1. morpheme/형태소 + ส่วนหนึ่งของคำพูด (pos)/품사 tagger
- Hannanum (한나눔) (Java, C) [ลิงก์]
- KKMA (꼬꼬마) (Java) [ลิงก์] [กระดาษ]
- Komoran (Java) [ลิงก์]
- mecab-ko (c ++) [ลิงก์]
- Twitter (Scala, Java) [ลิงก์]
- Konlpy (Python) [ลิงก์]
- .net, node.js, Python, Ruby, การเชื่อมโยงการค้นหา Elasitc
- dparser (REST API) [ลิงก์]
- Utagger [Link]
- Arirang (Lucence, Java) [Link]
- Rouzeta [ลิงก์] [Slide] [วิดีโอ]
- Seunjeon (Scala, Java) [Link]
- แรด (라이노) [ลิงก์]
- kts [กระดาษ]
- 깜짝새 [ลิงก์]
1.2. ชื่อเอนทิตี (NE) Tagger / 개체명인식기인식기
1.3. ตัวตรวจสอบสะกด / 맞춤법맞춤법
- PNU cellag checker [ลิงก์]
- ตัวตรวจสอบคาถานาวี [ลิงก์]
- ตัวตรวจสอบคาถา daum [ลิงก์]
- hunspell-ko [ลิงก์]
1.4. ตัวแยกวิเคราะห์ไวยากรณ์ / 구문분석기
- dparser (REST API) [ลิงก์]
- NLP Hub (Java) [ลิงก์]
1.5. การวิเคราะห์ทางอารมณ์ / 감정감정
- OpenHangul (오픈한글) [ลิงก์] [กระดาษ]
1.6. นักแปล / 번역기
- NAVER NMT [LINK]
- opennmt [ลิงก์]
- Google Translator [ลิงก์]
1.7. แพ็คเกจ
- konlp (r) [ลิงก์]
- Konlpy (Python) [Link] [Paper]
- Koalanlp (Scala) [Link]
- NLTK (Python) [ลิงก์] [กระดาษ]
- Gensim (Python) [ลิงก์]
- FastText (c) [ลิงก์]
- fastText.py (Python) [ลิงก์]
1.8. อื่น ๆ / 기타
- Hangulpy (Python) [Link]
- Hangulize (Python) [ลิงก์]
- Hanja (Python) [ลิงก์]
- Kroman [ลิงก์]
- Hangul Romanization
- Ruby, Python, Nodejs, Objective-C, Swift
- Hangul (Perl) [Link]
- textrankr (Python) [ลิงก์] [สาธิต]
- 한국어 word2vec [demo] [กระดาษ]
- 한국어 word2vec 의การทดสอบการเปรียบเทียบ데모
- 나쁜 [ลิงก์]
- crowdsourced dic เกี่ยวกับ badword ในเกาหลี
2. ชุดข้อมูล
- Sejong Corpus [ลิงก์]
- Kaist Corpus [Link]
- Yonsei Univ. คอร์ปัส
- เกาหลี คอร์ปัส
- Ulsan Univ. คอร์ปัส [ลิงก์]
- Wikipedia Dump [Link] [Extractor]
- Namuwiki Dump [Link] [Extractor]
- Naver News Archive [ลิงก์]
- Chosun Archive [Link]
- Naver Sentiment Movie Corpus [Link]
- Sci-News-Sum-KR-50 [ลิงก์]
3. บล็อก / สไลด์ / นักวิจัย
3.1. บล็อก
- บล็อกของ DSINDEX [ลิงก์]
- 엑사젠, "혼자한국어개발하기개발하기개발하기개발하기개발하기개발하기개발하기개발하기
- beomsu kim, "word2vec 관련" [ลิงก์]
- CPUU, "Google 자연어오픈소스 syntaxnet 공개" (tranlsation เกาหลีของ Google บล็อก) [ลิงก์]
- Theeluwin, "Python-crfsuite 를한국어띄어쓰기를띄어쓰기를학습해보자학습해보자학습해보자학습해보자학습해보자학습해보자학습해보자
- Jaesoo Lim, "한국어분석기동향동향동향동향동향동향동향동향동향
3.2. สไลด์
- Lucy Park, "한국어와 nltk, gensim 의만남만남만남만남만남만남만남만남만남만남만남만남의만남의
- Jeongkyu Shin, "การสร้าง AI แชทบอทโดยใช้ Python 3 & Tensorflow" (Pycon APAC 2016) [ลิงก์]
- Changki Lee "แอปพลิเคชัน RNN & NLP" (Kangwon Univ. หลักสูตรการเรียนรู้ของเครื่อง) [ลิงก์]
- Kyunghoon Kim, "뉴스를방법방법; 뉴스잼" (Pycon APAC 2016)
- Hongjoo Lee "Python 으로 19 대뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기뽀개기
- Kyumin Choi, "Word2vec 이" (Pycon APAC 2015) [ลิงก์]
- 進藤裕之 (แปลโดย Hongbae Kim), "딥러닝을자연어처리의연구동향연구동향연구동향연구동향연구동향연구동향연구동향연구동향연구동향
- Hongbae Kim, "머신러닝의 (i)" [ลิงก์]
- Changki Lee "자연어처리를기계학습소개소개소개소개소개소개소개소개소개소개소개소개소개
- Taeil Kim, Daeneung Son, "기계모델기반시스템시스템시스템시스템시스템시스템시스템시스템시스템
4. เอกสาร
4.1. เกาหลี
김동준, 이연수, 장정선, 임해창, 고려대학교, (주) 엔씨소프트, "한국어대화화행 (2015 년동계학술발표회동계학술발표회논문집동계학술발표회논문집논문집)" [กระดาษ] เชื่อมโยงตาย
4.2. ภาษาอังกฤษ
5. การบรรยาย
5.1. การบรรยายเกาหลี
- Kangwon Univ 자연언어처리 [ลิงก์]
- 데이터 [ลิงก์]
- SNU Data Mining / Business Analytics [ลิงก์]
5.2. การบรรยายภาษาอังกฤษ
- Stanford CS224N: การประมวลผลภาษาธรรมชาติ [ลิงก์] [YouTube]
- Stanford CS224D: การเรียนรู้อย่างลึกซึ้งสำหรับการประมวลผลภาษาธรรมชาติ [ลิงก์] [YouTube]
- NLTK กับ Python 3 สำหรับ NLP (โดย Sentdex) [YouTube]
- รุ่นหัวข้อ LDA [ลิงก์]
6. การประชุม / สถาบัน / เหตุการณ์
6.1. การประชุม
- 한글 [ลิงก์]
- kips (한국정보처리학회) [ลิงก์]
- 한국음성학회 [ลิงก์]
6.2. สถาบัน
- 언어공학연구회 [ลิงก์]
- 한글 (ตั้งแต่ปี 1989, 매년) [ลิงก์]
- 국어 (ตั้งแต่ปี 2010, 매년, 주최: 문화체육관광부) [ลิงก์]
- 자연언어처리 (비정기적) [ลิงก์]
- 자연어처리 [ลิงก์]
- 한국음성학회 [ลิงก์]
6.3. กิจกรรม / การแข่งขัน
7. ชุมชนออนไลน์
- Tensorflow KR (กลุ่ม Facebook) [ลิงก์]
- AI Korea (กลุ่ม Facebook) [ลิงก์]
- กลุ่มบอท (กลุ่ม Facebook) [ลิงก์]
- 바벨피쉬 (กลุ่ม Facebook) [ลิงก์]
- Reddit Machine Learning โพสต์ด้านบน [ลิงก์]
8. จะมีส่วนร่วมอย่างไร
แยกที่เก็บนี้โดยคลิกที่ไอคอน "Fork" ที่มุมบนขวา
รับลิงค์สำหรับ repo ที่มีการจัดเรียงโดยคลิกที่ปุ่มสีเขียวในหน้าของคุณ บางอย่างเช่น "https://github.com/ [ouldusername เหมือนกัน/awesome-korean-nlp.git"
บนเครื่องในพื้นที่ของคุณ "git clone https://github.com/ [oulusername เหมือนกัน/awesome-korean-nlp.git"
"CD Awesome-Korean-NLP"
เปิด "readme.md" ด้วยตัวแก้ไขข้อความที่คุณชื่นชอบ
แก้ไข.
git commit -a -m "เพิ่มมาตรา 8: emoticons"
git push และตรวจสอบบนส้อมของคุณ
goto https://github.com/datanada/awesome-korean-nlp และสร้างคำขอดึง
"เปรียบเทียบข้ามส้อม" กับฐาน: datanada/น่ากลัว .. และหัว: [ชื่อผู้ใช้]/น่ากลัว ..
[คู่มือผู้เริ่มต้น]