Motor de búsqueda
Motor de búsqueda para libros (Java, Apache Lucene, Crawler4J, Apache Spark)
- Grascó alrededor de 100,000 páginas web utilizando Crawler4J y realizó un análisis de enlaces mediante la implementación de PageRank en el gráfico web con GraphX de Apache Spark.
- Indexó los documentos rastreados usando Apache Lucene y ordenaron los documentos para cada consulta mediante una combinación de puntaje de PageRank y TF/IDF.