Semester Search - это утилита для быстрого поиска через загружаемые материалы класса, чтобы вы могли потратить больше времени на обучение и меньше времени на щелчок через десятки ссылок на веб -сайтах вашего профессора.


./documents , чтобы поместить ваши документы вmain.go Поместив ваши документы (протестированные с помощью PDF, PPTX и DOC) в каталог documents , программа будет сканироваться через них, отмечая какие -либо новые документы с тех пор, как вы открыли поисковую утилиту.
Если вы не добавили никаких новых документов, двигатель будет использовать кэшированные версии (проанализированных) документов для выполнения ваших поисков.
Если вы добавили или удалили документы с момента вашего последнего поиска, двигатель повторно переведет ваши документы. Это происходит путем запуска сервера Tika (включая его загрузку, если его не установлено), а затем подарив каждый из ваших документов в Сервис. Сервер отвечает корпусом документа, который затем хранится для поиска.
После загрузки документов в память (либо из кэша, либо через анализ), двигатель создаст полный индекс поиска текста из своего контента. Используя этот индекс, пользователи могут искать документы, которые содержат то, что они ищут. Результаты на этом этапе отсортированы по хитам по документу.
Чтобы погрузиться глубже, в каждом документе выполняется еще один текстовый поиск, чтобы получить конкретные выдержки, которые вы можете просмотреть, чтобы убедиться, что вы смотрите на правильный документ. Эти методы поиска документов включают точное сопоставление фразы, сопоставление фразы Stemmed, сопоставление близости поиска и сопоставление с терминами.
Когда вы нашли правильный документ (и просмотр только отрывки недостаточно), вы можете использовать выделенный сочетание клавиатуры, чтобы открыть его в любимом просмотре документов.
Примечание: этот проект требует, чтобы Java запустила, так как зависит сервер анализа документов Tika