CS276
Mes notes de lecture pour CS276: récupération d'informations et recherche Web, printemps 2019 de l'Université de Stanford.
Contient principalement le résumé des chapitres de l'introduction à la récupération de l'information, ainsi que des mémos pour certaines diapositives de conférence et autres sources.
Remarque: Pour faire face aux notations mathématiques, j'ai utilisé Pandoc pour convertir toutes les notes de démarque en PDF de latex. Je pense que c'est la solution la plus simple en ce moment pour voir les formules mathématiques sur Github. Veuillez me faire savoir si vous pensez qu'il y a une meilleure solution.
Semaine 01: Introduction et récupération booléenne
- IIR Chapitre 01: Booléen Retrieval
- IIR Chapitre 02: Le terme de vocabulaire et de listes de postes
Semaine 02: Plus d'index inversé
- IIR Chapitre 04: Construction d'index
- IIR Chapitre 05: Compression d'index
Semaine 03: Retriel tolérante et modèle d'espace vectoriel
- IIR Chapitre 03: Dictionnaires et récupération tolérante
- Plus sur la chaîne bruyante
- IIR Chapitre 06: Notation, pondération à terme et modèle d'espace vectoriel
Semaine 04: récupération probabiliste
- IIR Chapitre 11: Récupération des informations probabilistes
Semaine 05: Évaluation du système IR et accélération des requêtes de texte libre
- IIR Chapitre 8: Évaluation de la récupération de l'information
- IIR Chapitre 7: Scores informatiques dans un système de recherche complet
Semaine 06: Classification du texte utilisant Naive Bayes, KNN et SVM
- IIR Chapitre 13: Classification du texte et Bayes naïf
- IIR Chapitre 14: Classification de l'espace vectoriel
- IIR Chapitre 15: Soutenir les machines vectorielles et l'apprentissage automatique sur les documents (WIP)
Semaine 07: Word Embeddings
- Remarques de la conférence 14: Représentations de mots distribués pour la récupération de l'information
Semaine 09: ramper et répondre aux questions
- Remarques de la conférence 19: Réponse aux questions