semester search
1.0.0
學期搜索是一種快速搜索可下載的課堂材料的實用程序,因此您可以花更多的時間學習,而更少的時間點擊了教授網站上的數十個鏈接。


./documents上創建一個目錄以將您的文檔放入main.go 將文檔(迄今為止使用PDF,PPTX和DOC測試)放入documents目錄之後,該程序將通過它們掃描,並指出自上次打開搜索實用程序以來的任何新文檔。
如果您沒有添加任何新文檔,則引擎將使用(解析)文檔的緩存版本執行您的搜索。
如果您自上次搜索以來添加或刪除了文檔,則引擎將重新索引您的文檔。它通過啟動Tika服務器(包括未安裝的話,包括下載它),然後將您的每個文檔饋送到服務來做到這一點。服務器對文檔的正文進行了響應,然後將其存儲供您搜索。
將文檔加載到內存後(來自緩存或通過解析)後,引擎將從其內容中創建全文搜索索引。使用此索引,用戶可以搜索以查找包含所需內容的文檔。此時的結果通過每個文檔進行命中。
更深入地深入研究,在每個文檔上進行了進一步的文本搜索,以獲取可以仔細閱讀的特定摘錄,以確保您正在查看正確的文檔。這些文檔特定的搜索方法包括精確的短語匹配,詞幹短語匹配,搜索術語接近度匹配和寬鬆的項匹配。
當您找到正確的文檔(僅查看摘錄是不夠的)時,您可以使用專用的鍵盤快捷鍵在您喜歡的文檔查看器中打開它。
注意:此項目需要Java運行,因為TIKA文檔解析服務器取決於它