python bm25
1.0.0
Этот проект реализует алгоритм BM25, описанный в этой статье для ранжирования документов в соответствии с актуальностью.
Обязательно запустите сценарий setup.sh . Он установит все необходимые зависимости.
Используйте python sample.py чтобы увидеть его в действии. Это может занять некоторое время, но в конечном итоге это будет печатать на консоли, полученные документы, соответствующие запросу, отсортированные по актуальности.
Эта реализация лучше всего подходит для небольших наборов данных, потому что ей не хватает инвертированного индекса, необходимого для быстрого запроса в больших наборах данных
https://github.com/nhirakawa/bm25