Vector-Database avec bibliothèque QDrant et intégrer avec des tansformateurs de phrases
Simulation d'une base de données vectorielle sur le jeu de données Conala.
Ensemble de données
- Conala: l'ensemble de données du Code / Natural Language Challenge pour récupérer les extraits du programme pertinents pour les requêtes utilisateur.
Frameworks
- Base de données vectorielle: base de données vectorielle en mémoire à l'aide de la bibliothèque QDrant.
- Embeddings: Transformateur de phrase (All-MinilM-L6-V2).
Fichiers
- Préparer_data.ipynb: Notebook Pour afficher les données et perfrom Analyse simple de l'ensemble de données.
- embeddings.ipynb: contiennent le code complet pour créer une intégration à l'aide de transformateurs de phrase, de la catabase vectorielle à l'aide de QDRANT, puis de récupération en fonction de la similitude des cosinus.
Si vous trouvez le repo utile, veuillez laisser tomber un