セマンティック検索を使用してドキュメントを見つけることができるツール
新しいバージョン-https://github.com/sarthakjain1206/intelligent_document_finder
昨年作成したドキュメントの正確な場所を覚えているのはどれほど簡単ですか?それほど簡単ではありませんよね?大規模な組織/人々は毎日何百もの文書を扱っており、ほとんどの場合、それらを忘れています。
しかし、いくつかの作業のためにその古いドキュメントをもう一度望んでいるが、残念ながら、そのドキュメントの名前や実際のコンテンツを覚えていない場合は、コンピューターの大規模なストレージから取得します。
そのような場合、インテリジェントなドキュメントファインダーを使用すると、本当に大きな違いが生じる可能性があります。として、クエリ入力に基づいて、必要性のドキュメントを( semantically )検索できます。これは、ドキュメントへのより速いアクセスに役立つだけでなく、同様のドキュメントをグループ化して分析するのにも役立ちます。
現在、このリポジトリは、Webスクレイピングによって収集されたニュース記事の事前定義されたデータベースを使用しています。大きなファイルのアップロードに関するGitHubの制限により、ここにアップロードすることはできません。
まもなく、動的データベースのサポートを追加して、独自のデータベースにこのツールを使用して独自のカスタム検索エンジンを構築できるようにします。
Python3.6 JavaScript HTML/CSS

> mkdir IntelligentDocumentFinder
> cd IntelligentDocumentFinder
> git clone https://github.com/Sarthakjain1206/Intelligent-Document-Finder
インストールされていない場合は、vitual環境をインストールしてください
> python3 -m pip install --user virtualenv> py -m pip install --user virtualenv仮想環境を作成します
> python3 -m venv env> py -m venv env環境をアクティブにする:
> source env/bin/activate> .envScriptsactivate > pip install -r requirements.txt
このリンクからグローブワードの埋め込みをダウンロードし、それを減圧してglove.6B.100dをコピーします。6B.100D DataBaseフォルダーに
次に、このコマンド> python initial_file.pyを介してinitial_file.pyを実行します
今、あなたは行きます..あなたがそれにアクセスするたびにこのコマンドを入力し、Chrome/Firefoxでウェブサイトを開きます> python src/app.py