Инструмент, который может найти любой документ, используя семантический поиск .
Это импровизированная версия интеллектуального документирования
Список новых функций-
Насколько легко вы обнаружите, что это запомнить точное местоположение документа, который вы создали в прошлом году? Не очень легко, верно? Крупные организации/люди ежедневно имеют дело с сотнями документов и забывают о них большую часть времени.
Но что, если мы снова хотим эту старую документацию для некоторой работы, но, к сожалению, вы не помните имя или фактическое содержание этого документа, чтобы извлечь его из большого хранения вашего компьютера.
В таких случаях использование интеллектуального искателя документов может действительно иметь огромное значение. Как, он может искать документ ( semantically ) ваших потребностей на основе ввода запроса. Это не только поможет в более быстром доступе к документу, но также поможет в группировании аналогичных документов вместе и в их анализе.
Смотреть демо проекта:
В настоящее время это хранилище использует предопределенную базу данных новостных статей, собравшихся с помощью Web Scraping. Из -за ограничений GitHub при загрузке больших файлов мы не можем загрузить его здесь.
Вскоре мы добавим поддержку динамических баз данных, чтобы вы могли использовать этот инструмент для ваших собственных баз данных для создания собственной поисковой системы.
Python3.6 JavaScript jQuery HTML & CSS

> mkdir IntelligentDocumentFinder
> cd IntelligentDocumentFinder
> git clone https://github.com/Sarthakjain1206/Intelligent_Document_Finder_2.0.git
Установите Vitual Environment, если не установлена
> python3 -m pip install --user virtualenv> py -m pip install --user virtualenvСоздать виртуальную среду
> python3 -m venv env> py -m venv envАктивировать среду:
> source env/bin/activate> .envScriptsactivate > pip install -r requirements.txt
Скачать glove Word Enterdings из этой ссылки, распаковывать его и скопировать glove.6B.100d в папке DataBase
Затем запустите initial_file.py через эту команду > python initial_file.py
Теперь вы готовы идти .. просто введите эту команду каждый раз, когда вы хотите получить к ней, и откройте веб -сайт в Chrome/Firefox
> python src/app.py
Вы можете связаться с нами на профилях LinkedLn
Sarthak Jain Machine Learning NLP Web Crawling
Вы также можете подписаться на меня на GitHub, чтобы оставаться в курсе моих последних проектов
Rishabh Mishra Full Stack Web Developer
Вы также можете подписаться на меня на GitHub, чтобы оставаться в курсе моих последних проектов
Если вам понравился этот репозиторий, то поддержите его, дав ему звезду
Есть много функций, которые можно добавить в этот инструмент.
Если у вас есть какой -либо опыт внедрения какой -либо из этих функций, сделайте вклад .
Удивительная статья об алгоритме рейтинга BM25 на Википедии - Okapi BM25
Прочитайте эту статью о моделировании темы
Полностью последовала за этой прекрасной статьей о тегах SVOS для создания тегов для этого проекта.
Использовал реализацию фонда BM25 Рейтинг из этого великого репозиитрии на GitHub от dorianbrown .