可以使用语义搜索找到任何文档的工具。
这是即兴版的智能文档-Finder
新功能列表 -
您发现它如何容易记住您去年创建的文档的确切位置?不是很容易,对吧?大型组织/人们每天都在处理数百个文件,并且大部分时间都忘记了它们。
但是,如果我们再次希望该旧文档进行某些工作,但是不幸的是,您不记得该文档的名称或实际内容可以从计算机的大存储中检索它。
在这种情况下,使用智能文档查找器确实可以产生巨大的变化。因为,它可以根据查询输入( semantically )搜索您的需求文档。这不仅将有助于更快地访问文档,而且还将有助于将类似的文档分组在一起并分析它们。
观看项目演示:
目前,此存储库正在使用通过网络刮擦收集的新闻文章的预定义数据库。由于GitHub对上传大文件的限制,我们无法在此处上传。
很快,我们将添加动态数据库的支持,以便您可以将此工具用于自己的数据库来构建自己的自定义搜索引擎。
Python3.6 JavaScript jQuery HTML & CSS

> mkdir IntelligentDocumentFinder
> cd IntelligentDocumentFinder
> git clone https://github.com/Sarthakjain1206/Intelligent_Document_Finder_2.0.git
如果未安装,请安装活性环境
> python3 -m pip install --user virtualenv> py -m pip install --user virtualenv创建虚拟环境
> python3 -m venv env> py -m venv env激活环境:
> source env/bin/activate> .envScriptsactivate > pip install -r requirements.txt
从此链接下载手套字嵌入,解压缩并复制glove.6B.100d DataBase夹中的6b.100d文件
然后,通过此命令> python initial_file.py运行initial_file.py.py
现在您很好。.只需每次要访问它时键入此命令,然后在Chrome/firefox中打开网站> python src/app.py
您可以在LinkedLN个人资料上与我们联系
Sarthak Jain Machine Learning NLP Web Crawling
您也可以在Github上关注我,以保持有关我最新项目的最新信息
Rishabh Mishra Full Stack Web Developer
您也可以在Github上关注我,以保持有关我最新项目的最新信息
如果您喜欢这个存储库,请通过给它来支持它
可以在此工具中添加许多功能。
如果您有实施这些功能的任何经验,那么确实会做出贡献。
Wikipedia上的BM25排名算法的可怕文章-Okapi BM25
阅读有关主题建模的本文
完全遵循了有关SVOS标签的精美文章,用于为该项目生成标签。
使用了dorianbrown在Github上的这一出色的存储库中的BM25排名fuction实施。