CS276
บันทึกการอ่านของฉันสำหรับ CS276: การดึงข้อมูลและการค้นหาเว็บ, ฤดูใบไม้ผลิ 2019 จากมหาวิทยาลัยสแตนฟอร์ด
ส่วนใหญ่มีบทสรุปของบทจากบทนำสู่การดึงข้อมูลพร้อมกับบันทึกสำหรับสไลด์บรรยายและแหล่งข้อมูลอื่น ๆ
หมายเหตุ: เพื่อรับมือกับสัญลักษณ์ทางคณิตศาสตร์ฉันได้ใช้ PANDOC เพื่อแปลงหมายเหตุ Markdown ทั้งหมดเป็น LaTex PDF ฉันคิดว่านี่เป็นวิธีแก้ปัญหาที่ง่ายที่สุดในขณะนี้เพื่อดูสูตรคณิตศาสตร์ใน GitHub โปรดแจ้งให้เราทราบหากคุณคิดว่ามีทางออกที่ดีกว่า
สัปดาห์ที่ 01: บทนำและการเรียกคืนบูลีน
- IIR บทที่ 01: การเรียกคืนบูลีน
- IIR บทที่ 02: คำศัพท์คำศัพท์และรายการโพสต์
สัปดาห์ที่ 02: เพิ่มเติมเกี่ยวกับดัชนีคว่ำ
- IIR บทที่ 04: การก่อสร้างดัชนี
- IIR บทที่ 05: การบีบอัดดัชนี
สัปดาห์ที่ 03: การดึงข้อมูลแบบทนต่อและโมเดลพื้นที่เวกเตอร์
- IIR บทที่ 03: พจนานุกรมและการสืบค้นที่อดทน
- เพิ่มเติมเกี่ยวกับช่องที่มีเสียงดัง
- IIR บทที่ 06: การให้คะแนนการถ่วงน้ำหนักและโมเดลพื้นที่เวกเตอร์
สัปดาห์ที่ 04: การดึงความน่าจะเป็น
- IIR บทที่ 11: การดึงข้อมูลความน่าจะเป็น
สัปดาห์ที่ 05: การประเมินระบบ IR และการเร่งความเร็วสำหรับการสืบค้นข้อความฟรี
- IIR บทที่ 8: การประเมินผลในการดึงข้อมูล
- IIR บทที่ 7: คะแนนการคำนวณในระบบการค้นหาที่สมบูรณ์
สัปดาห์ที่ 06: การจำแนกข้อความโดยใช้ Naive Bayes, KNN และ SVM
- IIR บทที่ 13: การจำแนกข้อความและเบย์ไร้เดียงสา
- IIR บทที่ 14: การจำแนกพื้นที่เวกเตอร์
- IIR บทที่ 15: สนับสนุนเครื่องเวกเตอร์และการเรียนรู้ของเครื่องในเอกสาร (WIP)
สัปดาห์ที่ 07: การฝังคำ
- หมายเหตุจากการบรรยาย 14: การแสดงคำที่แจกจ่ายสำหรับการดึงข้อมูล
สัปดาห์ที่ 09: การคลานและตอบคำถาม
- หมายเหตุจากการบรรยาย 19: การตอบคำถาม