python bm25
1.0.0
該項目實施了本文中描述的BM25算法,以根據相關性對文檔進行排名。
確保運行setup.sh腳本。它將安裝所有必需的依賴項。
使用python sample.py在作用中看到它。這可能需要一些時間,但最終它將打印到與查詢相匹配的控制台檢索的文檔,並按相關性排序。
此實現最適合小型數據集,因為它缺少在大數據集中快速查詢所需的倒數索引
https://github.com/nhirakawa/bm25