semester search
1.0.0
学期搜索是一种快速搜索可下载的课堂材料的实用程序,因此您可以花更多的时间学习,而更少的时间点击了教授网站上的数十个链接。


./documents上创建一个目录以将您的文档放入main.go 将文档(迄今为止使用PDF,PPTX和DOC测试)放入documents目录之后,该程序将通过它们扫描,并指出自上次打开搜索实用程序以来的任何新文档。
如果您没有添加任何新文档,则引擎将使用(解析)文档的缓存版本执行您的搜索。
如果您自上次搜索以来添加或删除了文档,则引擎将重新索引您的文档。它通过启动Tika服务器(包括未安装的话,包括下载它),然后将您的每个文档馈送到服务来做到这一点。服务器对文档的正文进行了响应,然后将其存储供您搜索。
将文档加载到内存后(来自缓存或通过解析)后,引擎将从其内容中创建全文搜索索引。使用此索引,用户可以搜索以查找包含所需内容的文档。此时的结果通过每个文档进行命中。
更深入地深入研究,在每个文档上进行了进一步的文本搜索,以获取可以仔细阅读的特定摘录,以确保您正在查看正确的文档。这些文档特定的搜索方法包括精确的短语匹配,词干短语匹配,搜索术语接近度匹配和宽松的项匹配。
当您找到正确的文档(仅查看摘录是不够的)时,您可以使用专用的键盘快捷键在您喜欢的文档查看器中打开它。
注意:此项目需要Java运行,因为TIKA文档解析服务器取决于它