Vektordatabase mit QDrant-Bibliothek und Einbettung mit Satztansformern
Simulation einer Vektordatenbank im Conala -Datensatz.
Datensatz
- CONALA: Der Code/Natural Language Challenge -Datensatz zum Abrufen von Programmausschnitten für Benutzeranfragen.
Frameworks
- Vektordatenbank: In-Memory-Vektor-Datenbank mit QDrant Library.
- Einbettungen: Satztransformator (All-Minilm-L6-V2).
Dateien
- prepe_data.ipynb: Notebook, um die Daten anzuzeigen und die einfache Analyse des Datensatzes zu erhalten.
- Einbettung.IPynb: Enthält den vollständigen Code zum Erstellen von Einbettung mit Satztransformen, Vektordatenabse unter Verwendung von QDrant und dann auf der Grundlage von Cosinus-Ähnlichkeit.
Wenn Sie das Repo hilfreich finden, lassen Sie bitte a