python bm25
1.0.0
该项目实施了本文中描述的BM25算法,以根据相关性对文档进行排名。
确保运行setup.sh脚本。它将安装所有必需的依赖项。
使用python sample.py在作用中看到它。这可能需要一些时间,但最终它将打印到与查询相匹配的控制台检索的文档,并按相关性排序。
此实现最适合小型数据集,因为它缺少在大数据集中快速查询所需的倒数索引
https://github.com/nhirakawa/bm25