CS276
Mis notas de lectura para CS276: Recuperación de información y búsqueda web, primavera de 2019 de la Universidad de Stanford.
Principalmente contiene el resumen de los capítulos de la introducción a la recuperación de la información, junto con notas para ciertas diapositivas de conferencias y otras fuentes.
Nota: Para hacer frente a las anotaciones matemáticas, he usado pandoc para convertir todas las notas de markdown en PDF de látex. Creo que esta es la solución más fácil en este momento para ver las fórmulas matemáticas en GitHub. Por favor, avíseme si cree que hay una mejor solución.
Semana 01: Introducción y recuperación booleana
- IIR Capítulo 01: Recuperación booleana
- IIR Capítulo 02: El término vocabulario y listas de publicaciones
Semana 02: Más sobre índice invertido
- IIR Capítulo 04: Construcción del índice
- IIR Capítulo 05: Compresión de índice
Semana 03: Recuperación tolerante y modelo de espacio vectorial
- IIR Capítulo 03: Diccionarios y recuperación tolerante
- Más en el canal ruidoso
- IIR Capítulo 06: puntuación, ponderación de términos y modelo de espacio vectorial
Semana 04: recuperación probabilística
- IIR Capítulo 11: Recuperación de información probabilística
Semana 05: Evaluación del sistema IR y aceleraciones para consultas de texto gratuitas
- IIR Capítulo 8: Evaluación en la recuperación de la información
- IIR Capítulo 7: puntajes informáticos en un sistema de búsqueda completo
Semana 06: Clasificación de texto usando Naive Bayes, KNN y SVM
- IIR Capítulo 13: Clasificación de texto y Bayes ingenuos
- IIR Capítulo 14: Clasificación de espacio vectorial
- IIR Capítulo 15: Máquinas vectoriales de soporte y aprendizaje automático en documentos (WIP)
Semana 07: incrustaciones de palabras
- Notas de la conferencia 14: Representaciones de palabras distribuidas para la recuperación de información
Semana 09: Graseo y respuesta a las preguntas
- Notas de la conferencia 19: Respuesta de preguntas