(ทำงานอยู่ระหว่างดำเนินการ!)
การประมวลผลภาษาธรรมชาติ (NLP) ได้ก้าวหน้าไปมากในช่วงไม่กี่ปีที่ผ่านมาเนื่องจากความสำเร็จของเทคนิคสมัยใหม่ที่อยู่บนพื้นฐานของการเรียนรู้อย่างลึกซึ้ง ด้วยการเพิ่มขึ้นของความนิยมของ NLP และความพร้อมใช้งานของข้อมูลขนาดใหญ่ที่แตกต่างกันตอนนี้จำเป็นยิ่งกว่าที่จะเข้าใจการทำงานภายในของเทคนิคและแนวคิด NLP จากหลักการแรกในขณะที่พวกเขาพบวิธีการใช้งานจริงและการใช้งานที่ส่งผลกระทบต่อสังคม การสร้างสัญชาตญาณและการเข้าใจแนวคิดต่าง ๆ เป็นสิ่งสำคัญสำหรับการคิดเทคนิคนวัตกรรมการปรับปรุงการวิจัยและการสร้างเทคโนโลยี AI และ NLP ที่ปลอดภัยเป็นศูนย์กลางมนุษย์เป็นศูนย์กลาง
เราแนะนำซีรี่ส์ใหม่ที่เรียกว่า Fundamentals of NLP ซึ่งเรามุ่งมั่นที่จะสอนเกี่ยวกับเทคนิคและแนวคิด NLP ที่สำคัญที่เริ่มต้นจากหลักการแรก เราจะแนะนำแง่มุมทางทฤษฎีและแรงจูงใจของแต่ละแนวคิดที่ครอบคลุมตลอดซีรีส์ จากนั้นเราจะได้รับประสบการณ์จริงโดยใช้วิธี bootstrap เครื่องมือมาตรฐานอุตสาหกรรมและห้องสมุดโอเพนซอร์ซอื่น ๆ เพื่อใช้เทคนิคที่แตกต่างกัน ระหว่างทางเราจะครอบคลุมแนวปฏิบัติที่ดีที่สุดแบ่งปันการอ้างอิงที่สำคัญชี้ให้เห็นข้อผิดพลาดทั่วไปเพื่อหลีกเลี่ยงเมื่อการฝึกอบรมและการสร้างแบบจำลอง NLP และหารือเกี่ยวกับสิ่งที่อยู่ข้างหน้า
เข้าร่วมชุมชน Slack ของเราเพื่อค้นหาข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้และโครงการต่อเนื่องอื่น ๆ อย่าลังเลที่จะติดต่อฉันทาง Twitter เพื่อขอคำเชิญไปยังกลุ่ม Slack ของเรา
บทที่ 1: Tokenization, lemmatization, stemming และการแบ่งส่วนประโยค - สมุดบันทึก colab, เวอร์ชันเว็บ
nlp_fundamentals หลัก ปัญหาเกี่ยวกับแท็ก good first issue เป็นงานที่ดีในการเริ่มต้น