คุณสามารถค้นหาข้อมูลเกี่ยวกับหลักสูตรในโพสต์บล็อกนี้และวิดีโอบรรยายทั้งหมดมีอยู่ที่นี่
หลักสูตรนี้ได้รับการสอนครั้งแรกในโครงการวิทยาศาสตร์วิทยาศาสตร์สาขาวิทยาศาสตร์ของมหาวิทยาลัยซานฟรานซิสโกในช่วงฤดูร้อนปี 2019 หลักสูตรนี้ได้รับการสอนใน Python พร้อมสมุดบันทึก Jupyter โดยใช้ห้องสมุดเช่น Sklearn, NLTK, Pytorch และ Fastai
หัวข้อต่อไปนี้จะครอบคลุม:
1. NLP คืออะไร?
2. การสร้างแบบจำลองหัวข้อด้วย NMF และ SVD
3. การจำแนกความเชื่อมั่นกับ Bayes ไร้เดียงสาการถดถอยโลจิสติกและ ngrams
4. regex (และการเยี่ยมชมโทเค็นใหม่)
5. การสร้างแบบจำลองภาษาและการจำแนกความเชื่อมั่นด้วยการเรียนรู้อย่างลึกซึ้ง
6. การแปลด้วย RNNS
7. การแปลด้วยสถาปัตยกรรมหม้อแปลง
8. อคติและจริยธรรมใน NLP
หลักสูตรนี้มีโครงสร้างด้วยวิธีการสอน จากบนลงล่าง ซึ่งแตกต่างจากการทำงานของหลักสูตรคณิตศาสตร์ส่วนใหญ่ โดยทั่วไปในวิธีการ จากล่างขึ้นบน คุณจะเรียนรู้ส่วนประกอบแยกต่างหากทั้งหมดที่คุณจะใช้และจากนั้นคุณค่อยๆสร้างมันขึ้นมาเป็นโครงสร้างที่ซับซ้อนมากขึ้น ปัญหาเกี่ยวกับเรื่องนี้คือนักเรียนมักจะสูญเสียแรงจูงใจไม่มีความรู้สึกของ "ภาพใหญ่" และไม่รู้ว่าพวกเขาต้องการอะไร
ศาสตราจารย์ฮาร์วาร์ดเดวิดเพอร์กินส์มีหนังสือทำให้การเรียนรู้ทั้งหมดซึ่งเขาใช้เบสบอลเป็นการเปรียบเทียบ เราไม่ต้องการให้เด็กจดจำกฎทั้งหมดของเบสบอลและเข้าใจรายละเอียดทางเทคนิคทั้งหมดก่อนที่เราจะปล่อยให้พวกเขาเล่นเกม แต่พวกเขาเริ่มเล่นด้วยความรู้สึกทั่วไปของมันแล้วค่อยๆเรียนรู้กฎ/รายละเอียดเพิ่มเติมเมื่อเวลาผ่านไป
หากคุณเรียนหลักสูตรการเรียนรู้อย่างรวดเร็วที่สุดนั่นคือสิ่งที่เราใช้ คุณสามารถได้ยินเพิ่มเติมเกี่ยวกับปรัชญาการสอนของฉันในโพสต์บล็อกนี้หรือการพูดคุยนี้ที่ฉันให้ไว้ที่การประชุมการเรียนรู้ของเครื่อง San Francisco
ทั้งหมดที่พูดไม่ต้องกังวลถ้าคุณไม่เข้าใจทุกอย่างในตอนแรก! คุณไม่ควร เราจะเริ่มใช้ "กล่องดำ" แล้วเราจะขุดลงในรายละเอียดระดับล่างในภายหลัง
ในการเริ่มต้นให้ความสำคัญกับสิ่งที่ทำไม่ใช่สิ่งที่พวกเขาเป็น