Download von gifts_py - Download von gifts

gifts_py

Anderer Quellcode

1.0.0

Herunterladen

Geschenke

Suche nach Elementen mit den gemeinsamen Funktionen mit der Abfrage.

 query = [ 'A' , 'B' ]

elements = [
    [ 'N' , 'A' , 'M' ],  # common features: 'A'
    [ 'C' , 'B' , 'A' ],  # common features: 'A', 'B'  
    [ 'X' , 'Y' ]  # no common features
]

In diesem Fall die Suche mit return ['C', 'B', 'A'] und ['N', 'A', 'M'] in dieser bestimmten Reihenfolge.

Verwendung für die Volltext-Suche

Finden von Dokumenten, die Wörter aus der Abfrage enthalten.

 from gifts import SmoothFts

fts = SmoothFts ()

fts . add ([ "wait" , "mister" , "postman" ],
        doc_id = "doc1" )

fts . add ([ "please" , "mister" , "postman" , "look" , "and" , "see" ],
        doc_id = "doc2" )

fts . add ([ "oh" , "yes" , "wait" , "a" , "minute" , "mister" , "postman" ],
        doc_id = "doc3" )

# print IDs of documents in which at least one word of the query occurs, 
# starting with the most relevant matches
for doc_id in fts . search ([ 'postman' , 'wait' ]):
    print ( doc_id )

Verwendung für abstrakte Data Mining

In den obigen Beispielen waren die Wörter buchstäblich Wörter als Saiten. Aber sie können alle Objekte sein, die als dict geeignet sind.

 from gifts import SmoothFts

fts = SmoothFts ()

fts . add ([ 3 , 1 , 4 , 1 , 5 , 9 , 2 ], doc_id = "doc1" )
fts . add ([ 6 , 5 , 3 , 5 ], doc_id = "doc2" )
fts . add ([ 8 , 9 , 7 , 9 , 3 , 2 ], doc_id = "doc3" )

for doc_id in fts . search ([ 5 , 3 , 7 ]):
    print ( doc_id )

Implementierungsdetails

Bei der Rangliste der Ergebnisse berücksichtigt der Algorithmus :: ::

Die Anzahl der passenden Wörter
Die Seltenheit solcher Wörter in der Datenbank
Die Häufigkeit des Auftretens von Wörtern im Dokument

Smoothfts

 from gifts import SmoothFts

Es verwendet logarithmische TF-IDF zum Gewicht der Wörter und der Kosinus-Ähnlichkeit für die Bewertung der Übereinstimmungen.

Einfache

 from gifts import SimpleFts

Minimalistischer Ansatz: Wiegen, multiplizieren, vergleichen. Dieses Objekt ist merklich schneller als SmoothFts .

Installieren

Pip

pip3 install git+https://github.com/rtmigo/gifts_py#egg=gifts

setup.py

 install_requires = [
    "gifts@ git+https://github.com/rtmigo/gifts_py"
]

Siehe auch

Das Skifts-Paket sucht die gleiche Suche, verwendet jedoch Scikit-Learn und Numpy, um eine bessere Leistung zu erzielen. Es ist buchstäblich hunderte Male schneller.

Expandieren

Zusätzliche Informationen