รายการทรัพยากรเริ่มต้นในการประมวลผลภาษาธรรมชาติ
ผู้ดูแล
Dibya Chakravorty
ผลงาน
อย่าลังเลที่จะส่งคำขอดึงหรือส่งอีเมลถึงฉัน ([email protected])
รายการนี้เริ่มต้นอย่างไร
เมื่อวันที่ 10 พฤศจิกายน 2559 ผู้ใช้ Hacker News (HN) Aarohmankad ได้ขอคำแนะนำจากชุมชน HN เกี่ยวกับแหล่งข้อมูล NLP เริ่มต้น เธรด HN นี้กลายเป็นที่นิยมและอยู่ในหน้าแรกสักพัก ในเวลานี้มันรวบรวมคำแนะนำที่สร้างชุมชนมากมายเกี่ยวกับทรัพยากร NLP เริ่มต้น รายการนี้เป็นความพยายามที่จะสรุปการสนทนานี้ลงในรายการทรัพยากรที่สอดคล้องกัน ฉันยังเขียนบล็อกโพสต์เกี่ยวกับเรื่องนี้
สารบัญ
- หนังสือ
- MOOCS
- วิดีโอ YouTube
- หลักสูตรมหาวิทยาลัยออนไลน์
- แพ็คเกจที่จะเล่นด้วย
- เอกสารวิชาการ
- การเรียนรู้โดยการทำ
- โครงการโอเพ่นซอร์ส
- ไอเดียสนุก ๆ
- APIs
- กลุ่มผู้ใช้
- คู่มืออื่น ๆ
หนังสือ
- การประมวลผลคำพูดและภาษา: ตำราเรียนคลาสสิกและมาตรฐานใน NLP ฉบับพิมพ์ก่อนการตีพิมพ์ฉบับที่ 3 มีอยู่ที่นี่
- การประมวลผลภาษาธรรมชาติด้วย Python: หนังสือที่มุ่งเน้นแอปพลิเคชัน ตัวอย่างอยู่ใน Python (NLTK) เวอร์ชันออนไลน์ฟรีที่นี่
- Taming Text: หนังสือที่มุ่งเน้นแอปพลิเคชัน ตัวอย่างอยู่ในชวา
- รากฐานของการประมวลผลภาษาธรรมชาติทางสถิติ: ข้อความคลาสสิกบนสถิติ NLP ลึกเข้าไปในการใช้งานของตัวแยกวิเคราะห์แท็กเกอร์ ฯลฯ
- คู่มือการประมวลผลภาษาธรรมชาติ: การรักษา NLP ที่สมบูรณ์ซึ่งเริ่มต้นจากรากประวัติศาสตร์และจบลงด้วยวิธีการที่ทันสมัยของ NLP
- การแปลเครื่องทางสถิติ: เรียนรู้วิธีการให้บริการเช่น Google Translate
- ข้อมูลเบื้องต้นเกี่ยวกับการดึงข้อมูล: เรียนรู้น็อตและสลักเกลียวของบริการเช่น Google Search และ Google News (ค้นหาการจำแนกข้อความการจัดกลุ่มการจัดกลุ่ม ฯลฯ )
- การวิเคราะห์ภาษาและภาษาธรรมชาติ: ใช้ NLP algortihms ใน Prolog
MOOCS
- หลักสูตร Coursera ที่นำเสนอโดย University of Michigan: หลักสูตรเบื้องต้นที่ครอบคลุมวัสดุที่จำเป็นต้องมีทั้งหมด ภาษาการเขียนโปรแกรมที่ชื่นชอบคือ Python
- หลักสูตร Dicontinued Coursera ที่เปิดสอนโดยมหาวิทยาลัย Comlumbia มีให้บริการใน torrents เชิงวิชาการ: ทฤษฎีและหลักสูตรที่มุ่งเน้นแนวคิด มีเฉพาะวัสดุหลักสูตรที่มีอยู่ในจุดนี้
วิดีโอ YouTube
- ซีรีย์วิดีโอโดย Jurafsky และ Martin: Jurafsky และ Martin เป็นอาจารย์ทั้งสองที่ Stanford และพวกเขาได้เขียนตำราเรียนคลาสสิกหลายเล่มบน NLP
- Stanford CS224D: การเรียนรู้อย่างลึกซึ้งใน NLP: Applicatin of Deep Learning ใน NLP
- NLP พร้อม Python และ NLTK: ซีรีย์วิดีโอที่มุ่งเน้นแอปพลิเคชันโดยใช้ Python และ NLTK
หลักสูตรมหาวิทยาลัยออนไลน์
- หลักสูตรการแปลเครื่องจักรที่มหาวิทยาลัยเพนซิลเวเนีย
แพ็คเกจที่จะเล่นด้วย
- NLTK: ห้องสมุด NLP ยอดนิยมมากที่สุดใน Python เอกสารที่ยอดเยี่ยมในรูปแบบของหนังสือ/เวอร์ชันออนไลน์ฟรี ทรงพลังและขยายได้
- Stanford Corenlp: ห้องสมุด NLP ที่รวดเร็วและรวดเร็วและมีคุณสมบัติเขียนใน Java มีการสาธิตออนไลน์ที่นี่
- Spacy: ห้องสมุด NLP ที่เกิดขึ้นใหม่ใน Python รวดเร็วและทันสมัยศิลปะ พยายามรักษา API เครื่องแบบในขณะที่ใช้อัลกอริทึมที่ทันสมัย พวกเขามีบล็อกและการสาธิตออนไลน์
- Apache Tika: เสนออินเทอร์เฟซแบบครบวงจรสำหรับการแยกข้อมูลข้อความและข้อมูลเมตาจากรูปแบบไฟล์ที่แตกต่างกันมากมาย (PPT, PDF ฯลฯ ) และการวิเคราะห์
เอกสารวิชาการ
- การเรียนรู้อย่างลึกซึ้งใน NLP: repo github ที่รวบรวมเอกสารเกี่ยวกับการเรียนรู้ลึกใน NLP
การเรียนรู้โดยการทำ
บ่อยครั้งที่วิธีที่ดีที่สุดในการเรียนรู้คือการมีส่วนร่วมในโครงการ NLP โอเพ่นซอร์สที่มีอยู่หรือใช้ความคิดที่สนุกสนาน
โครงการโอเพ่นซอร์ส
- เบ็ตตี้: เบ็ตตี้เป็นโครงการโอเพ่นซอร์สที่มีทั้งการใช้ชีวิตจริงและการพิจารณา NLP ในทางปฏิบัติและกำลังมองหาผู้ดูแลใหม่
ไอเดียสนุก ๆ
- นิยายอิงนิยาย/ตัวแยกวิเคราะห์แบบโต้ตอบ: วิดีโอเกมที่การโต้ตอบของผู้เล่นเกี่ยวข้องกับข้อความเป็นหลัก ฟังพอดคาสต์ Floss ที่ให้แสงสว่างนี้ในหัวข้อ
APIs
- IBM Watson Cloud: จากผู้ผลิตของ IBM Watson ช่วยให้คุณรวมฟังก์ชั่น NLP ในแอพของคุณผ่าน API มีการทดลองใช้ระดับฟรี/ฟรี
กลุ่มผู้ใช้
- ACM พิเศษกลุ่มที่น่าสนใจใน AI: หากคุณอยากเผชิญหน้ากับการติดต่อกับมนุษย์
คู่มืออื่น ๆ
- คำถามเกี่ยวกับวิธีเข้าสู่ NLP
- Awesome-NLP บน GitHub: repo gitHub ที่มีรายการทรัพยากร NLP ที่ได้รับการดูแล