Ce projet démontre l'utilisation d' Elasticsearch pour les tâches de recherche vectorielle. Le cahier Jupyter fourni, vector_search.ipynb , charge un modèle d'intégration à l'aide sentence-transformers , crée des incorporations pour le champ de questions et de réponses combiné et crée un moteur de recherche de vecteur pour rechercher des questions utilisateur dans des documents FAQ. Nous évaluons les résultats des moteurs de recherche en utilisant le taux de succès et le rang réciproque moyen (MRR). Enfin, évaluez Elasticsearch, qui est plus efficace car il utilise des techniques approximatives plutôt que de calculer la similitude avec tous les vecteurs, produisant des résultats identiques.
Pour configurer le projet, suivez ces étapes:
pip install pipenv
pipenv installEnsuite, sélectionnez l'environnement PiPenv dans le noyau Jupyter.
Pour exécuter le conteneur Docker ElasticSearch, utilisez la commande suivante:
docker run -it
--rm
--name elasticsearch
-p 9200:9200
-p 9300:9300
-e " discovery.type=single-node "
-e " xpack.security.enabled=false "
docker.elastic.co/elasticsearch/elasticsearch:8.4.3