Buku-pencarian-mesin
Mesin pencari untuk buku (Java, Apache Lucene, Crawler4j, Apache Spark)
- Merangkak sekitar 100.000 halaman web menggunakan Crawler4j dan melakukan analisis tautan dengan mengimplementasikan PageRank pada grafik web dengan graphx Apache Spark.
- Diindeks dokumen merangkak menggunakan Apache Lucene dan memesan dokumen untuk setiap kueri dengan kombinasi skor PageRank dan TF/IDF.