Le modèle de chiffon permet aux entreprises d'utiliser les capacités de raisonnement des LLM, en utilisant leurs modèles existants pour traiter et générer des réponses en fonction de nouvelles données. Le RAG facilite les mises à jour périodiques de données sans avoir besoin de réglage fin, rationalisant ainsi l'intégration des LLM dans les entreprises.
L'accélérateur de solution de chiffon Enterprise (GPT-RAG) propose une architecture robuste adaptée au déploiement de qualité d'entreprise du motif de chiffon. Il garantit des réponses à la terre et est construite sur une sécurité zéro-frust et une IA responsable, garantissant la disponibilité, l'évolutivité et l'auditabilité. Idéal pour les organisations passant des étapes d'exploration et du POC à la production à grande échelle et aux MVP.
Consultez notre guide utilisateur et admin pour les détails complets de configuration et d'utilisation.
GPT-RAG suit une approche modulaire, composée de trois composantes, chacune avec une fonction spécifique.
Ingestion de données - Optimise le groupe de données et l'indexation pour l'étape de récupération de chiffon.
Orchestrator - Coordonne le flux pour récupérer des informations et générer une réponse de l'utilisateur. Il offre deux options: fonctionnel , en utilisant des fonctions de noyau sémantique (par défaut) et agents , en utilisant des agents autogen. Voir les instructions de déploiement pour passer à l'agentique.
App front-end - utilise le modèle de backend pour le modèle frontal pour fournir une interface Web évolutive et efficace.
Si vous voulez en savoir plus sur le motif de chiffon et l'architecture GPT-RAG.
Modèle de chiffon: quoi et pourquoi?
Présentation de l'architecture de la solution
Apprenez à configurer rapidement l'architecture de base pour les scénarios sans isolement de réseau. Cliquez sur le lien pour continuer.
Déployez l'accélérateur de solution à l'aide de l'architecture standard de la lutte zéro avec des paramètres de solution préconfigurés. Aucune personnalisation nécessaire. Cliquez sur le lien pour continuer.
Explorez les options de personnalisation du déploiement de l'accélérateur de solution avec une architecture zéro-frust, en ajustant les paramètres de la solution à vos besoins. Cliquez sur le lien pour continuer.
Pour ceux qui préfèrent le contrôle complet, suivez ce guide détaillé pour configurer manuellement l'accélérateur de solution avec une architecture zéro-frust. Cliquez sur le lien pour continuer.
Ce guide vous guidera à travers le processus de déploiement de l'entreprise RAG. Il existe deux options de déploiement disponibles, une architecture de base et une architecture de fiducie zéro . Avant de commencer le déploiement, veuillez vous assurer d'avoir préparé tous les outils et services nécessaires tels que décrits dans la section pré-requis .
Pré-requis
** Si vous n'avez pas créé de ressource de service Azure AI dans l'abonnement avant
Pour des démonstrations rapides ou des projets de preuve de concept sans exigences d'isolement du réseau, vous pouvez déployer l'accélérateur en utilisant son architecture de base. 
La procédure de déploiement est assez simple, installez simplement les conditions préalables mentionnées ci-dessus et suivez ces quatre étapes à l'aide du développeur Azure CLI (AZD) dans un terminal:
1 Téléchargez le référentiel:
azd init -t azure/gpt-ragRemarque : Ajouter
-b agenticsi vous utilisez l'orchestrateur à base d'autogène.azd init -t azure/gpt-rag -b agentic
2 Connectez-vous à Azure:
2.Une CLI du développeur Azure:
azd auth login2.B Azure CLI:
az login3 Commencez à construire le déploiement des infrastructures et des composants:
azd up4 Ajouter des documents source au stockage d'objets
Téléchargez vos documents dans le dossier «Documents» situé dans le compte de stockage. Le nom de ce compte doit commencer par «strag». Il s'agit du compte de stockage par défaut, comme indiqué dans l'échantillon d'image ci-dessous.

Fait! Le déploiement de base est terminé.
Recommandé : ajoutez l'authentification de l'application. Regardez ce tutoriel rapide pour les conseils étape par étape.
Pour les déploiements plus sécurisés et isolés, vous pouvez opter pour l'architecture Zero Trust. Cette architecture est idéale pour les environnements de production où l'isolement du réseau et les mesures de sécurité strictes sont très appréciées.

Avant de déployer l'architecture Zero Trust, assurez-vous de revoir les conditions préalables. Il est important de noter que vous n'aurez besoin que Node.js et Python pour la deuxième partie du processus, qui sera effectué sur la machine virtuelle créée lors du déploiement de cette architecture.
La procédure de déploiement est similaire à celle de l'architecture de base, mais avec quelques étapes supplémentaires. Pour un guide détaillé sur le déploiement de cette option, reportez-vous aux instructions ci-dessous:
1 Téléchargez le référentiel
azd init -t azure/gpt-ragRemarque : Ajouter
-b agenticsi vous utilisez l'orchestrateur à base d'autogène.azd init -t azure/gpt-rag -b agentic
2 Activer l'isolement du réseau
azd env set AZURE_NETWORK_ISOLATION true 3 Connectez-vous à Azure:
2.Une CLI du développeur Azure:
azd auth login2.B Azure CLI:
az login4 Commencez à construire le déploiement des infrastructures et des composants:
azd provision5 Ensuite, vous utiliserez la machine virtuelle avec la connexion Bastion (créée à l'étape 4) pour continuer le déploiement.
Connectez-vous à la machine virtuelle créée avec l'utilisateur GPTRAG et authentifiez avec le mot de passe stocké dans KeyVault, similaire à la figure ci-dessous:

6 En accédant à Windows, installez PowerShell, car les autres conditions préalables sont déjà installées sur la machine virtuelle.
7 Ouvrez l'invite de commande et exécutez la commande suivante pour mettre à jour AZD à la dernière version:
choco upgrade azd
Après avoir mis à jour AZD, fermez et rouvrez simplement le terminal.
8 Créez un nouveau répertoire, par exemple, deploy puis entrez le répertoire créé.
mkdir deploy
cd deploy
Pour finaliser la procédure, exécutez les commandes suivantes dans l'invite de commande pour terminer avec succès le déploiement:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
Remarque: Lors de l'exécution de l'
azd init ...etazd env refresh, utilisez le même nom d'environnement, abonnement et région utilisé dans le provisionnement initial de l'infrastructure.
Fait! Le déploiement de la fiducie zéro est terminé.
Recommandé : ajoutez l'authentification de l'application. Regardez ce tutoriel rapide pour les conseils étape par étape.
Cette section fournit des guides rapides pour la personnalisation, la gestion et le dépannage de votre déploiement.
Le processus de déploiement standard configure les ressources Azure et déploie les composants de l'accélérateur avec une configuration standard. Pour adapter le déploiement à vos besoins spécifiques, suivez les étapes de la section de déploiement personnalisé pour d'autres options de personnalisation.
Une fois que vous avez déployé avec succès la solution GPT-RAG en tant que preuve de concept et que vous êtes prêt à formaliser le déploiement à l'aide d'un processus CI / CD approprié pour accélérer votre déploiement en production, reportez-vous aux guides de déploiement multi-environnement pour Azure DevOps ou GitHub.
Si vous rencontrez des erreurs pendant le processus de déploiement, consultez la page de dépannage pour obtenir des conseils sur la résolution des problèmes communs.
Pour évaluer les performances de votre déploiement, reportez-vous au guide de test de performance pour les méthodologies de test et les meilleures pratiques.
Apprenez à interroger et à analyser les données de conversation en suivant les étapes décrites dans le document How To Query et analyser les conversations.
Comprenez les implications des coûts de votre déploiement en examinant le modèle de tarification pour une estimation détaillée des prix.
Assurer une bonne gouvernance de votre déploiement en suivant les directives fournies dans le modèle de gouvernance.
Nous apprécions votre intérêt à contribuer à ce projet! Veuillez vous référer à la page contribution.md pour des directives détaillées sur la façon de contribuer, y compris des informations sur le contrat de licence des contributeurs (CLA), le code de conduite et le processus de soumission des demandes de traction.
Merci pour votre soutien et vos contributions!
Ce projet peut contenir des marques ou des logos pour des projets, des produits ou des services. L'utilisation autorisée de marques ou de logos Microsoft est soumise et doit suivre les directives de marque et de marque de Microsoft. L'utilisation de marques ou de logos de Microsoft dans des versions modifiées de ce projet ne doit pas provoquer de confusion ou impliquer le parrainage de Microsoft. Toute utilisation de marques ou de logos tiers est soumis aux politiques de ces tiers.