Engine de pesquisa de livros
Mecanismo de pesquisa por livros (Java, Apache Lucene, Crawler4J, Apache Spark)
- Rastreou cerca de 100.000 páginas da web usando Crawler4J e executou a análise de link implementando o PageRank no gráfico da web com o GraphX da Apache Spark.
- Indexou os documentos rastejados usando o Apache Lucene e ordenou os documentos para cada consulta por uma combinação de PageRank e TF/IDF.