可以使用語義搜索找到任何文檔的工具。
這是即興版的智能文檔-Finder
新功能列表 -
您發現它如何容易記住您去年創建的文檔的確切位置?不是很容易,對吧?大型組織/人們每天都在處理數百個文件,並且大部分時間都忘記了它們。
但是,如果我們再次希望該舊文檔進行某些工作,但是不幸的是,您不記得該文檔的名稱或實際內容可以從計算機的大存儲中檢索它。
在這種情況下,使用智能文檔查找器確實可以產生巨大的變化。因為,它可以根據查詢輸入( semantically )搜索您的需求文檔。這不僅將有助於更快地訪問文檔,而且還將有助於將類似的文檔分組在一起並分析它們。
觀看項目演示:
目前,此存儲庫正在使用通過網絡刮擦收集的新聞文章的預定義數據庫。由於GitHub對上傳大文件的限制,我們無法在此處上傳。
很快,我們將添加動態數據庫的支持,以便您可以將此工具用於自己的數據庫來構建自己的自定義搜索引擎。
Python3.6 JavaScript jQuery HTML & CSS

> mkdir IntelligentDocumentFinder
> cd IntelligentDocumentFinder
> git clone https://github.com/Sarthakjain1206/Intelligent_Document_Finder_2.0.git
如果未安裝,請安裝活性環境
> python3 -m pip install --user virtualenv> py -m pip install --user virtualenv創建虛擬環境
> python3 -m venv env> py -m venv env激活環境:
> source env/bin/activate> .envScriptsactivate > pip install -r requirements.txt
從此鏈接下載手套字嵌入,解壓縮並複制glove.6B.100d DataBase夾中的6b.100d文件
然後,通過此命令> python initial_file.py運行initial_file.py.py
現在您很好。.只需每次要訪問它時鍵入此命令,然後在Chrome/firefox中打開網站> python src/app.py
您可以在LinkedLN個人資料上與我們聯繫
Sarthak Jain Machine Learning NLP Web Crawling
您也可以在Github上關注我,以保持有關我最新項目的最新信息
Rishabh Mishra Full Stack Web Developer
您也可以在Github上關注我,以保持有關我最新項目的最新信息
如果您喜歡這個存儲庫,請通過給它來支持它
可以在此工具中添加許多功能。
如果您有實施這些功能的任何經驗,那麼確實會做出貢獻。
Wikipedia上的BM25排名算法的可怕文章-Okapi BM25
閱讀有關主題建模的本文
完全遵循了有關SVOS標籤的精美文章,用於為該項目生成標籤。
使用了dorianbrown在Github上的這一出色的存儲庫中的BM25排名fuction實施。