Usó Java para desarrollar un motor de búsqueda roscado que rastreó las búsquedas de usuarios, permite a los usuarios rastrear páginas web y buscar un índice invertido creado a partir de páginas web rastreadas.
Procesa todos los archivos de texto en un directorio y sus subdirectorios, limpia y analiza el texto en tallos de palabras, y construye un índice invertido en memoria para almacenar el mapeo de los tallos de palabras a los documentos y posicionarse dentro de los documentos donde se encontraron esos tallos de palabras.
Admite búsqueda exacta y búsqueda parcial. Además, la aplicación puede rastrear el número total de palabras que se encuentran en cada archivo de texto, analizar y STEM un archivo de consulta, generar una lista ordenada de resultados de búsqueda del índice invertido y admite escribir esos resultados en un archivo JSON.
Admite un índice invertido a prueba de hilos y utiliza una cola de trabajo para construir y buscar el índice invertido usando múltiples subprocesos.
Admite el rastreo web y la adquisición de HTML
Admite el seguimiento de los usuarios y almacena el historial de usuarios