Moteur de recherche de livres
Moteur de recherche pour les livres (Java, Apache Lucene, Crawler4J, Apache Spark)
- A rampé environ 100 000 pages Web à l'aide de Crawler4j et effectué une analyse des liens en implémentant Pagerank sur le graphique Web avec le graphx d'Apache Spark.
- Indexé les documents rampants à l'aide d'Apache Lucene et a commandé les documents pour chaque requête par une combinaison de score PageRank et TF / IDF.