semantic search and llm chat app - semantic search and llm chat app Téléchargement

semantic search and llm chat app

Autre code source

1.0.0

Télécharger

Sémantique-recherche-et-llm-chat-app

Ce projet vise à mettre en œuvre une échelle de recherche sémantique de recherche et de SHAP-alimentée par chiffon. Il se compose de trois composantes principales:

 1.	Vector Store Database (chromadb_service): Manages and stores vector embeddings for efficient retrieval.
2.	Backend LLM-Powered API Service (llm_service): Handles the core logic and interacts with the LLM model.
3.	Frontend Application: Provides the user interface for interacting with the application.

La conception modulaire permet à chaque composant d'être évolutif indépendamment, permettant au système de gérer de grands volumes de trafic au besoin.

Pour le déploiement du monde réel, il est recommandé d'adopter une solution de base de données vectorielle distribuée au lieu de ChromAdB. De plus, d'autres améliorations seront nécessaires pour rendre l'application prête pour la production.

Cette configuration de projet n'est que le début de la création d'une application basée sur le chat prêt pour la production.

Comment gérer ce projet

Installez les dépendances (utilisez Python> = 3.10). Vous devrez ajouter Cmake_args variable d'environnement pour une installation LLMA-CPP-Python réussie. Pour les MacBooks Apple Silicon, veuillez utiliser la commande ci-dessous. Veuillez consulter la documentation officielle de LLMA-CPP-Python pour d'autres instructions spécifiques à la plate-forme. lien

CMAKE_ARGS="-DLLAMA_METAL=on"
pip install -r requirements.txt

Afterwords, dans la séquence suivante, exécutez chaque service.

1. Chromadb_service

Il s'agit d'un service de base de données vectorielle qui crée, modifie et met à jour les entrées de jeu de données. Suivez ces instructions ici

2. LLM_SERVICE

Ce service API est alimenté par le modèle LLAMA-2-7B pour l'interface de chat et utilise ChromAdb_Service pour la récupération de contexte. Suivez ces instructions ici

3. Frontend

Il s'agit d'une application frontend (Streamlit) qui s'appuie sur LLM_Service pour alimenter les fonctionnalités de chatbot et de recherche sémantique.

Pour démarrer l'application Frontend Exécutez la commande ci-dessous.

streamlit run frontend/1_Product_Chat.py

Veuillez me contacter sur LinkedIn pour toutes les questions liées à la mise en œuvre et aux technologies. N'hésitez pas à ouvrir les refus de traction pour de nouvelles améliorations. Merci!

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-29
taille 26.17KB
Provenant de Github

Applications connexes

ApnaChat Realtime Chat App In Flutter Firebase

2024-11-11
TensorRT LLM

2024-11-10
huanhuan chat

2024-11-10
Recherche de mots 800

2024-11-08
azure search python samples

2024-11-05
Recherche de mots Jeu de puzzle de mots Dernière version

2024-07-11

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout