Das Lappenmuster ermöglicht es Unternehmen, die Argumentationsfunktionen von LLMs zu verwenden, wobei ihre vorhandenen Modelle anhand neuer Daten verarbeitet und generiert werden. RAG erleichtert regelmäßige Datenaktualisierungen, ohne dass eine Feinabstimmung erforderlich ist, wodurch die Integration von LLMs in Unternehmen optimiert wird.
Die Enterprise Rag Solution Accelerator (GPT-RAG) bietet eine robuste Architektur, die auf die Bereitstellung des Lag-Musters von Unternehmensgrads zugeschnitten ist. Es gewährleistet geerdete Antworten und basiert auf der Sicherheit von Null-Trust und der verantwortungsvollen KI, wodurch Verfügbarkeit, Skalierbarkeit und Prüfbarkeit gewährleistet werden. Ideal für Organisationen, die von Explorations- und POC-Phasen zu vollem Maßstab zur Produktion und MVPs übergehen.
In unserem Benutzer- und Administratorhandbuch finden Sie vollständige Einrichtungs- und Nutzungsdetails.
Die GPT-RAG folgt einem modularen Ansatz, der aus drei Komponenten besteht, die jeweils eine bestimmte Funktion haben.
Datenaufnahme - Optimiert das Daten -Chunking und -indexierung für den Rag -Abrufschritt.
Orchestrator - koordiniert den Fluss, um Informationen abzurufen und eine Benutzerantwort zu generieren. Es bietet zwei Optionen: funktional , unter Verwendung semantischer Kernelfunktionen (Standard) und Agentic unter Verwendung von Autogen -Wirkstoffen. Siehe Bereitstellungsanweisungen, um zu Agenten umzusteigen.
App Front-End -verwendet das Backend für Front-End-Muster, um eine skalierbare und effiziente Weboberfläche bereitzustellen.
Wenn Sie mehr über das Lappenmuster und die GPT-RAG-Architektur erfahren möchten.
Lappenmuster: Was und warum?
Lösungsarchitekturübersicht
Erfahren Sie, wie Sie die grundlegende Architektur für Szenarien ohne Netzwerk -Isolation schnell einrichten . Klicken Sie auf den Link, um fortzufahren.
Stellen Sie den Lösungsbeschleuniger mit der Standard-Null-Trust-Architektur mit vorkonfigurierten Lösungseinstellungen ein. Keine Anpassung erforderlich. Klicken Sie auf den Link, um fortzufahren.
Erforschen Sie die Optionen zum Anpassen der Bereitstellung des Lösungsbeschleunigers mit einer Null-Trust-Architektur und passen Sie die Lösungseinstellungen an Ihre Anforderungen an. Klicken Sie auf den Link, um fortzufahren.
Für diejenigen, die die vollständige Kontrolle bevorzugen, befolgen Sie diese detaillierte Anleitung, um den Lösungsbeschleuniger mit einer Null-Trust-Architektur manuell einzurichten. Klicken Sie auf den Link, um fortzufahren.
Mit diesem Leitfaden führt Sie durch den Bereitstellungsprozess von Enterprise Rag. Es stehen zwei Bereitstellungsoptionen zur Verfügung, grundlegende Architektur und Zero Trust Architecture . Stellen Sie vor Beginn der Bereitstellung sicher, dass Sie alle erforderlichen Tools und Dienste im Abschnitt Voraussetzungen vorbereitet haben.
Voraussetzungen
** Wenn Sie im Abonnement noch keine Azure AI Service -Ressource erstellt haben
Für schnelle Demonstrationen oder Proof-of-Concept-Projekte ohne Anforderungen an die Netzwerkisolation können Sie den Beschleuniger mit seiner grundlegenden Architektur bereitstellen. 
Das Bereitstellungsverfahren ist recht einfach. Installieren Sie einfach die oben genannten Voraussetzungen und befolgen Sie diese vier Schritte mit Azure Developer CLI (AZD) in einem Terminal:
1 Laden Sie das Repository herunter:
azd init -t azure/gpt-ragHINWEIS : Fügen Sie
-b agentichinzu, wenn Sie den agierischen autogenbasierten Orchestrator verwenden.azd init -t azure/gpt-rag -b agentic
2 Anmelden Sie sich bei Azure an:
2. Ein Azure -Entwickler CLI:
azd auth login2.B Azure CLI:
az login3 Beginnen Sie mit dem Aufbau der Bereitstellung von Infrastruktur und Komponenten:
azd up4 Fügen Sie Quelldokumente zum Objektspeicher hinzu
Laden Sie Ihre Dokumente in den Ordner "Dokumente" hoch, der sich im Speicherkonto befindet. Der Name dieses Kontos sollte mit 'Strag' beginnen. Dies ist das Standardspeicherkonto, wie im folgenden Beispielbild gezeigt.

Erledigt! Grundlegende Bereitstellung ist abgeschlossen.
Empfohlen : App -Authentifizierung hinzufügen. Sehen Sie sich dieses schnelle Tutorial für Schritt-für-Schritt-Anleitung an.
Für sicherere und isolierte Bereitstellungen können Sie sich für die Null -Trust -Architektur entscheiden. Diese Architektur ist ideal für Produktionsumgebungen, in denen die Netzwerkisolation und strenge Sicherheitsmaßnahmen hoch geschätzt werden.

Überprüfen Sie vor der Bereitstellung der Null -Trust -Architektur die Voraussetzungen. Es ist wichtig zu beachten, dass Sie für den zweiten Teil des Prozesses nur Node.js und Python benötigen, der für die VM durchgeführt wird, die während der Bereitstellung dieser Architektur erstellt wurde.
Das Bereitstellungsverfahren ähnelt dem der grundlegenden Architektur, jedoch mit einigen zusätzlichen Schritten. Eine detaillierte Anleitung zum Bereitstellen dieser Option finden Sie in den folgenden Anweisungen:
1 Laden Sie das Repository herunter
azd init -t azure/gpt-ragHINWEIS : Fügen Sie
-b agentichinzu, wenn Sie den agierischen autogenbasierten Orchestrator verwenden.azd init -t azure/gpt-rag -b agentic
2 Netzwerkisolation aktivieren
azd env set AZURE_NETWORK_ISOLATION true 3 Anmelden Sie sich bei Azure an:
2. Ein Azure -Entwickler CLI:
azd auth login2.B Azure CLI:
az login4 Beginnen Sie mit dem Aufbau der Bereitstellung von Infrastruktur und Komponenten:
azd provision5 Als nächstes verwenden Sie die virtuelle Maschine mit der Bastion -Verbindung (erstellt in Schritt 4), um die Bereitstellung fortzusetzen.
Melden Sie sich mit dem Benutzer GPTRAG in die erstellte VM an und authentifizieren sich mit dem im KeyVault gespeicherten Kennwort, ähnlich der folgenden Abbildung:

6 Installieren Sie beim Zugriff auf Windows PowerShell, da die anderen Voraussetzungen bereits auf der VM installiert sind.
7 Öffnen Sie die Eingabeaufforderung und führen Sie den folgenden Befehl aus, um AZD auf die neueste Version zu aktualisieren:
choco upgrade azd
Nach dem Aktualisieren von AZD schließen Sie einfach das Terminal und öffnen Sie sie wieder.
8 Erstellen Sie beispielsweise ein neues Verzeichnis. deploy beispielsweise das erstellte Verzeichnis ein.
mkdir deploy
cd deploy
Führen Sie die nachfolgenden Befehle in der Eingabeaufforderung aus, um die Bereitstellung erfolgreich abzuschließen:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
HINWEIS: Verwenden Sie beim Ausführen der
azd init ...undazd env refreshdenselben Umgebungsnamen, Abonnement und Region, die für die anfängliche Bereitstellung der Infrastruktur verwendet werden.
Erledigt! Die Bereitstellung von Zero Trust ist abgeschlossen.
Empfohlen : App -Authentifizierung hinzufügen. Sehen Sie sich dieses schnelle Tutorial für Schritt-für-Schritt-Anleitung an.
Dieser Abschnitt enthält schnelle Anleitungen zum Anpassen, Verwalten und Fehlerbehebung Ihrer Bereitstellung.
Der Standard -Bereitstellungsprozess legt Azure -Ressourcen ein und bereitet die Beschleunigungskomponenten mit einer Standardkonfiguration bereit. Befolgen Sie die Schritte im Abschnitt Benutzerdefinierte Bereitstellung für weitere Anpassungsoptionen, um die Bereitstellung auf Ihre spezifischen Anforderungen zu vermitteln.
Sobald Sie die GPT-RAG-Lösung erfolgreich als Beweis für das Konzept eingesetzt haben und die Bereitstellung anhand eines ordnungsgemäßen CI/CD-Prozesss formalisieren können, um Ihre Bereitstellung für die Produktion zu beschleunigen, finden Sie die Bereitstellungsleitfäden für Multi-Umwelt für Azure DevOps oder GitHub.
Wenn Sie beim Bereitstellungsprozess auf Fehler stoßen, wenden Sie sich an die Seite Fehlerbehebung, um Anleitungen zur Lösung gemeinsamer Probleme zu erhalten.
Um die Leistung Ihrer Bereitstellung zu bewerten, finden Sie im Testen und Best Practices im Leistungsprüfungshandbuch.
Erfahren Sie, wie Sie Konversationsdaten abfragen und analysieren, indem Sie die im Dokument zum Abfragen und Analyse von Konversationen beschriebenen Schritten befolgen.
Verstehen Sie die Kostenauswirkungen Ihrer Bereitstellung, indem Sie das Preismodell für eine detaillierte Preisschätzung überprüfen.
Stellen Sie sicher, dass Ihr Einsatz eine ordnungsgemäße Governance für die im Governance -Modell angegebenen Richtlinien befolgt.
Wir schätzen Ihr Interesse daran, zu diesem Projekt beizutragen! Weitere Informationen zum Beitrag zur Beitragsleistung, einschließlich Informationen zur Sendungsanfragen, finden Sie in der Seite der beitragen.md.md -Seite, die einen Beitrag zur Beitragsrevision (CLA), den Verhaltenskodex und den Vorgang zur Übermittlung von Pull -Anfragen haben.
Vielen Dank für Ihre Unterstützung und Beiträge!
Dieses Projekt kann Marken oder Logos für Projekte, Produkte oder Dienstleistungen enthalten. Die autorisierte Verwendung von Microsoft -Marken oder Logos unterliegt den Marken- und Markenrichtlinien von Microsoft und muss folgen. Die Verwendung von Microsoft -Marken oder Logos in geänderten Versionen dieses Projekts darf keine Verwirrung verursachen oder Microsoft -Sponsoring implizieren. Jede Verwendung von Marken oder Logos von Drittanbietern unterliegt den Richtlinien dieses Drittanbieters.