python bm25
1.0.0
Dieses Projekt implementiert den in diesem Papier beschriebenen BM25 -Algorithmus, um Dokumente nach Relevanz zu bewerten.
Stellen Sie sicher, dass Sie das Skript setup.sh ausführen. Es wird alle erforderlichen Abhängigkeiten installiert.
Verwenden Sie python sample.py , um es in Aktion zu sehen. Es mag einige Zeit dauern, aber schließlich wird es in die Konsole abgerufene Dokumente, die der Abfrage entsprechen, nach Relevanz abgerufen werden.
Diese Implementierung ist am besten für kleine Datensätze geeignet, da ihnen der invertierte Index fehlt, der für die schnelle Abfrage in großen Datensätzen erforderlich ist
https://github.com/nhirakawa/bm25