Téléchargement GPT RAG - Téléchargement du code source GPT RAG

GPT RAG

Autre code source

1.0.0

Télécharger

Le modèle de chiffon permet aux entreprises d'utiliser les capacités de raisonnement des LLM, en utilisant leurs modèles existants pour traiter et générer des réponses en fonction de nouvelles données. Le RAG facilite les mises à jour périodiques de données sans avoir besoin de réglage fin, rationalisant ainsi l'intégration des LLM dans les entreprises.

L'accélérateur de solution de chiffon Enterprise (GPT-RAG) propose une architecture robuste adaptée au déploiement de qualité d'entreprise du motif de chiffon. Il garantit des réponses à la terre et est construite sur une sécurité zéro-frust et une IA responsable, garantissant la disponibilité, l'évolutivité et l'auditabilité. Idéal pour les organisations passant des étapes d'exploration et du POC à la production à grande échelle et aux MVP.

Consultez notre guide utilisateur et admin pour les détails complets de configuration et d'utilisation.

Composants d'application

GPT-RAG suit une approche modulaire, composée de trois composantes, chacune avec une fonction spécifique.

Ingestion de données - Optimise le groupe de données et l'indexation pour l'étape de récupération de chiffon.
Orchestrator - Coordonne le flux pour récupérer des informations et générer une réponse de l'utilisateur. Il offre deux options: fonctionnel , en utilisant des fonctions de noyau sémantique (par défaut) et agents , en utilisant des agents autogen. Voir les instructions de déploiement pour passer à l'agentique.
App front-end - utilise le modèle de backend pour le modèle frontal pour fournir une interface Web évolutive et efficace.

Concepts

Si vous voulez en savoir plus sur le motif de chiffon et l'architecture GPT-RAG.

Modèle de chiffon: quoi et pourquoi?
Présentation de l'architecture de la solution

Rag de l'entreprise + ingénierie rapide + finetuning + train (vidéo en espagnol)

Guide de configuration

Déploiement d'architecture de base: pour des démos rapides sans isolement de réseau

Apprenez à configurer rapidement l'architecture de base pour les scénarios sans isolement de réseau. Cliquez sur le lien pour continuer.

Déploiement d'architecture standard de la fiducie zéro: option de déploiement de la fiducie zéro plus rapide ⚡

Déployez l'accélérateur de solution à l'aide de l'architecture standard de la lutte zéro avec des paramètres de solution préconfigurés. Aucune personnalisation nécessaire. Cliquez sur le lien pour continuer.

Configuration d'architecture zéro-frust personnalisée: la plus utilisée

Explorez les options de personnalisation du déploiement de l'accélérateur de solution avec une architecture zéro-frust, en ajustant les paramètres de la solution à vos besoins. Cliquez sur le lien pour continuer.

Configuration manuelle étape par étape: architecture zéro-frust: approche pratique **

Pour ceux qui préfèrent le contrôle complet, suivez ce guide détaillé pour configurer manuellement l'accélérateur de solution avec une architecture zéro-frust. Cliquez sur le lien pour continuer.

Commencer

Ce guide vous guidera à travers le processus de déploiement de l'entreprise RAG. Il existe deux options de déploiement disponibles, une architecture de base et une architecture de fiducie zéro . Avant de commencer le déploiement, veuillez vous assurer d'avoir préparé tous les outils et services nécessaires tels que décrits dans la section pré-requis .

Pré-requis

Azure Developer CLI: Téléchargez AZD pour Windows, autres OS.
PowerShell 7+ avec module AZ (Windows uniquement): PowerShell, module AZ
Git: télécharger git
Node.js 16+ Windows / Mac Linux / WSL
Python 3.11: Télécharger Python
Lancer une création de services Azure AI et accepter les termes d'IA responsables **

** Si vous n'avez pas créé de ressource de service Azure AI dans l'abonnement avant

Déploiement d'architecture de base

Pour des démonstrations rapides ou des projets de preuve de concept sans exigences d'isolement du réseau, vous pouvez déployer l'accélérateur en utilisant son architecture de base.

La procédure de déploiement est assez simple, installez simplement les conditions préalables mentionnées ci-dessus et suivez ces quatre étapes à l'aide du développeur Azure CLI (AZD) dans un terminal:

1 Téléchargez le référentiel:

azd init -t azure/gpt-rag

Remarque : Ajouter -b agentic si vous utilisez l'orchestrateur à base d'autogène.
azd init -t azure/gpt-rag -b agentic

2 Connectez-vous à Azure:

2.Une CLI du développeur Azure:

azd auth login

2.B Azure CLI:

az login

3 Commencez à construire le déploiement des infrastructures et des composants:

azd up

4 Ajouter des documents source au stockage d'objets

Téléchargez vos documents dans le dossier «Documents» situé dans le compte de stockage. Le nom de ce compte doit commencer par «strag». Il s'agit du compte de stockage par défaut, comme indiqué dans l'échantillon d'image ci-dessous.

stockage_sample

Fait! Le déploiement de base est terminé.

Recommandé : ajoutez l'authentification de l'application. Regardez ce tutoriel rapide pour les conseils étape par étape.

Déploiement d'architecture de confiance zéro

Pour les déploiements plus sécurisés et isolés, vous pouvez opter pour l'architecture Zero Trust. Cette architecture est idéale pour les environnements de production où l'isolement du réseau et les mesures de sécurité strictes sont très appréciées.

Architecture de confiance zéro

Avant de déployer l'architecture Zero Trust, assurez-vous de revoir les conditions préalables. Il est important de noter que vous n'aurez besoin que Node.js et Python pour la deuxième partie du processus, qui sera effectué sur la machine virtuelle créée lors du déploiement de cette architecture.

La procédure de déploiement est similaire à celle de l'architecture de base, mais avec quelques étapes supplémentaires. Pour un guide détaillé sur le déploiement de cette option, reportez-vous aux instructions ci-dessous:

1 Téléchargez le référentiel

azd init -t azure/gpt-rag

Remarque : Ajouter -b agentic si vous utilisez l'orchestrateur à base d'autogène.
azd init -t azure/gpt-rag -b agentic

2 Activer l'isolement du réseau

azd env set AZURE_NETWORK_ISOLATION true

3 Connectez-vous à Azure:

2.Une CLI du développeur Azure:

azd auth login

2.B Azure CLI:

az login

4 Commencez à construire le déploiement des infrastructures et des composants:

azd provision

5 Ensuite, vous utiliserez la machine virtuelle avec la connexion Bastion (créée à l'étape 4) pour continuer le déploiement.

Connectez-vous à la machine virtuelle créée avec l'utilisateur GPTRAG et authentifiez avec le mot de passe stocké dans KeyVault, similaire à la figure ci-dessous:

Connexion de KeyVault

6 En accédant à Windows, installez PowerShell, car les autres conditions préalables sont déjà installées sur la machine virtuelle.

7 Ouvrez l'invite de commande et exécutez la commande suivante pour mettre à jour AZD à la dernière version:

 choco upgrade azd

Après avoir mis à jour AZD, fermez et rouvrez simplement le terminal.

8 Créez un nouveau répertoire, par exemple, deploy puis entrez le répertoire créé.

 mkdir deploy  
cd deploy

Pour finaliser la procédure, exécutez les commandes suivantes dans l'invite de commande pour terminer avec succès le déploiement:

 azd init -t azure/gpt-rag  
azd auth login   
azd env refresh  
azd package  
azd deploy

Remarque: Lors de l'exécution de l' azd init ... et azd env refresh , utilisez le même nom d'environnement, abonnement et région utilisé dans le provisionnement initial de l'infrastructure.

Fait! Le déploiement de la fiducie zéro est terminé.

Recommandé : ajoutez l'authentification de l'application. Regardez ce tutoriel rapide pour les conseils étape par étape.

Comment faire?

Cette section fournit des guides rapides pour la personnalisation, la gestion et le dépannage de votre déploiement.

Personnalisez votre déploiement

Le processus de déploiement standard configure les ressources Azure et déploie les composants de l'accélérateur avec une configuration standard. Pour adapter le déploiement à vos besoins spécifiques, suivez les étapes de la section de déploiement personnalisé pour d'autres options de personnalisation.

Déploiement multi-environnement

Une fois que vous avez déployé avec succès la solution GPT-RAG en tant que preuve de concept et que vous êtes prêt à formaliser le déploiement à l'aide d'un processus CI / CD approprié pour accélérer votre déploiement en production, reportez-vous aux guides de déploiement multi-environnement pour Azure DevOps ou GitHub.

Dépanner les problèmes de déploiement

Si vous rencontrez des erreurs pendant le processus de déploiement, consultez la page de dépannage pour obtenir des conseils sur la résolution des problèmes communs.

Évaluer les performances

Pour évaluer les performances de votre déploiement, reportez-vous au guide de test de performance pour les méthodologies de test et les meilleures pratiques.

Interroger l'histoire de la conversation

Apprenez à interroger et à analyser les données de conversation en suivant les étapes décrites dans le document How To Query et analyser les conversations.

Tarification estimée

Comprenez les implications des coûts de votre déploiement en examinant le modèle de tarification pour une estimation détaillée des prix.

Gérer la gouvernance

Assurer une bonne gouvernance de votre déploiement en suivant les directives fournies dans le modèle de gouvernance.

Communauté de chiffon d'entreprise

Discord Channel Enterprise Rag - Communauté connectée

Contributif

Nous apprécions votre intérêt à contribuer à ce projet! Veuillez vous référer à la page contribution.md pour des directives détaillées sur la façon de contribuer, y compris des informations sur le contrat de licence des contributeurs (CLA), le code de conduite et le processus de soumission des demandes de traction.

Merci pour votre soutien et vos contributions!

Marques

Ce projet peut contenir des marques ou des logos pour des projets, des produits ou des services. L'utilisation autorisée de marques ou de logos Microsoft est soumise et doit suivre les directives de marque et de marque de Microsoft. L'utilisation de marques ou de logos de Microsoft dans des versions modifiées de ce projet ne doit pas provoquer de confusion ou impliquer le parrainage de Microsoft. Toute utilisation de marques ou de logos tiers est soumis aux politiques de ces tiers.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-03-01
taille 9.37MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
La dernière version du cinéma et de la télévision GPT

2023-10-30

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout