python bm25
1.0.0
このプロジェクトは、関連性に応じてドキュメントをランキングするために、このホワイトペーパーで説明したBM25アルゴリズムを実装しています。
setup.shスクリプトを必ず実行してください。必要なすべての依存関係をインストールします。
python sample.pyを使用して動作しているのを確認してください。少し時間がかかるかもしれませんが、最終的には、関連性によってソートされたクエリに一致するコンソール取得ドキュメントに印刷されます。
この実装は、大きなデータセットでの高速クエリに必要な反転インデックスがないため、小さなデータセットに最適です。
https://github.com/nhirakawa/bm25