GPT RAG Download - GPT RAG -Quellcode -Download

GPT RAG

Anderer Quellcode

1.0.0

Herunterladen

Das Lappenmuster ermöglicht es Unternehmen, die Argumentationsfunktionen von LLMs zu verwenden, wobei ihre vorhandenen Modelle anhand neuer Daten verarbeitet und generiert werden. RAG erleichtert regelmäßige Datenaktualisierungen, ohne dass eine Feinabstimmung erforderlich ist, wodurch die Integration von LLMs in Unternehmen optimiert wird.

Die Enterprise Rag Solution Accelerator (GPT-RAG) bietet eine robuste Architektur, die auf die Bereitstellung des Lag-Musters von Unternehmensgrads zugeschnitten ist. Es gewährleistet geerdete Antworten und basiert auf der Sicherheit von Null-Trust und der verantwortungsvollen KI, wodurch Verfügbarkeit, Skalierbarkeit und Prüfbarkeit gewährleistet werden. Ideal für Organisationen, die von Explorations- und POC-Phasen zu vollem Maßstab zur Produktion und MVPs übergehen.

In unserem Benutzer- und Administratorhandbuch finden Sie vollständige Einrichtungs- und Nutzungsdetails.

Anwendungskomponenten

Die GPT-RAG folgt einem modularen Ansatz, der aus drei Komponenten besteht, die jeweils eine bestimmte Funktion haben.

Datenaufnahme - Optimiert das Daten -Chunking und -indexierung für den Rag -Abrufschritt.
Orchestrator - koordiniert den Fluss, um Informationen abzurufen und eine Benutzerantwort zu generieren. Es bietet zwei Optionen: funktional , unter Verwendung semantischer Kernelfunktionen (Standard) und Agentic unter Verwendung von Autogen -Wirkstoffen. Siehe Bereitstellungsanweisungen, um zu Agenten umzusteigen.
App Front-End -verwendet das Backend für Front-End-Muster, um eine skalierbare und effiziente Weboberfläche bereitzustellen.

Konzepte

Wenn Sie mehr über das Lappenmuster und die GPT-RAG-Architektur erfahren möchten.

Lappenmuster: Was und warum?
Lösungsarchitekturübersicht

Enterprise RAG+Eingabeaufforderungstechnik+Fellentuning+Zug (Video auf Spanisch)

Setup -Handbuch

Grundlegende Architekturbereitstellung: Schnelle Demos ohne Netzwerkisolation

Erfahren Sie, wie Sie die grundlegende Architektur für Szenarien ohne Netzwerk -Isolation schnell einrichten . Klicken Sie auf den Link, um fortzufahren.

Bereitstellung von Standard-Architektur-Architektur-Standard-Standard -Bereitstellungsoption ⚡ schnellste Zero-Trust-Bereitstellung ⚡

Stellen Sie den Lösungsbeschleuniger mit der Standard-Null-Trust-Architektur mit vorkonfigurierten Lösungseinstellungen ein. Keine Anpassung erforderlich. Klicken Sie auf den Link, um fortzufahren.

Custom Null-Trust-Architektur-Setup: Am häufigsten verwendete

Erforschen Sie die Optionen zum Anpassen der Bereitstellung des Lösungsbeschleunigers mit einer Null-Trust-Architektur und passen Sie die Lösungseinstellungen an Ihre Anforderungen an. Klicken Sie auf den Link, um fortzufahren.

Schritt-für-Schritt-Handbuch Setup: Null-Trust-Architektur: Praxis-on-Ansatz **

Für diejenigen, die die vollständige Kontrolle bevorzugen, befolgen Sie diese detaillierte Anleitung, um den Lösungsbeschleuniger mit einer Null-Trust-Architektur manuell einzurichten. Klicken Sie auf den Link, um fortzufahren.

Erste Schritte

Mit diesem Leitfaden führt Sie durch den Bereitstellungsprozess von Enterprise Rag. Es stehen zwei Bereitstellungsoptionen zur Verfügung, grundlegende Architektur und Zero Trust Architecture . Stellen Sie vor Beginn der Bereitstellung sicher, dass Sie alle erforderlichen Tools und Dienste im Abschnitt Voraussetzungen vorbereitet haben.

Voraussetzungen

Azure Developer CLI: Download AZD für Windows, andere Betriebssysteme.
PowerShell 7+ mit AZ -Modul (nur Windows): PowerShell, AZ Modul
Git: Download Git
Node.js 16+ Windows/Mac Linux/WSL
Python 3.11: Python herunterladen
Initiieren Sie eine Azure AI Services -Schöpfung und stimmen Sie den verantwortlichen KI

** Wenn Sie im Abonnement noch keine Azure AI Service -Ressource erstellt haben

Grundlegende Architekturbereitstellung

Für schnelle Demonstrationen oder Proof-of-Concept-Projekte ohne Anforderungen an die Netzwerkisolation können Sie den Beschleuniger mit seiner grundlegenden Architektur bereitstellen. Grundlegende Architektur

Das Bereitstellungsverfahren ist recht einfach. Installieren Sie einfach die oben genannten Voraussetzungen und befolgen Sie diese vier Schritte mit Azure Developer CLI (AZD) in einem Terminal:

1 Laden Sie das Repository herunter:

azd init -t azure/gpt-rag

HINWEIS : Fügen Sie -b agentic hinzu, wenn Sie den agierischen autogenbasierten Orchestrator verwenden.
azd init -t azure/gpt-rag -b agentic

2 Anmelden Sie sich bei Azure an:

2. Ein Azure -Entwickler CLI:

azd auth login

2.B Azure CLI:

az login

3 Beginnen Sie mit dem Aufbau der Bereitstellung von Infrastruktur und Komponenten:

azd up

4 Fügen Sie Quelldokumente zum Objektspeicher hinzu

Laden Sie Ihre Dokumente in den Ordner "Dokumente" hoch, der sich im Speicherkonto befindet. Der Name dieses Kontos sollte mit 'Strag' beginnen. Dies ist das Standardspeicherkonto, wie im folgenden Beispielbild gezeigt.

Storage_Sample

Erledigt! Grundlegende Bereitstellung ist abgeschlossen.

Empfohlen : App -Authentifizierung hinzufügen. Sehen Sie sich dieses schnelle Tutorial für Schritt-für-Schritt-Anleitung an.

Bereitstellung von Zero Trust Architecture

Für sicherere und isolierte Bereitstellungen können Sie sich für die Null -Trust -Architektur entscheiden. Diese Architektur ist ideal für Produktionsumgebungen, in denen die Netzwerkisolation und strenge Sicherheitsmaßnahmen hoch geschätzt werden.

Zero Trust Architecture

Überprüfen Sie vor der Bereitstellung der Null -Trust -Architektur die Voraussetzungen. Es ist wichtig zu beachten, dass Sie für den zweiten Teil des Prozesses nur Node.js und Python benötigen, der für die VM durchgeführt wird, die während der Bereitstellung dieser Architektur erstellt wurde.

Das Bereitstellungsverfahren ähnelt dem der grundlegenden Architektur, jedoch mit einigen zusätzlichen Schritten. Eine detaillierte Anleitung zum Bereitstellen dieser Option finden Sie in den folgenden Anweisungen:

1 Laden Sie das Repository herunter

azd init -t azure/gpt-rag

HINWEIS : Fügen Sie -b agentic hinzu, wenn Sie den agierischen autogenbasierten Orchestrator verwenden.
azd init -t azure/gpt-rag -b agentic

2 Netzwerkisolation aktivieren

azd env set AZURE_NETWORK_ISOLATION true

3 Anmelden Sie sich bei Azure an:

2. Ein Azure -Entwickler CLI:

azd auth login

2.B Azure CLI:

az login

4 Beginnen Sie mit dem Aufbau der Bereitstellung von Infrastruktur und Komponenten:

azd provision

5 Als nächstes verwenden Sie die virtuelle Maschine mit der Bastion -Verbindung (erstellt in Schritt 4), um die Bereitstellung fortzusetzen.

Melden Sie sich mit dem Benutzer GPTRAG in die erstellte VM an und authentifizieren sich mit dem im KeyVault gespeicherten Kennwort, ähnlich der folgenden Abbildung:

KeyVault Login

6 Installieren Sie beim Zugriff auf Windows PowerShell, da die anderen Voraussetzungen bereits auf der VM installiert sind.

7 Öffnen Sie die Eingabeaufforderung und führen Sie den folgenden Befehl aus, um AZD auf die neueste Version zu aktualisieren:

 choco upgrade azd

Nach dem Aktualisieren von AZD schließen Sie einfach das Terminal und öffnen Sie sie wieder.

8 Erstellen Sie beispielsweise ein neues Verzeichnis. deploy beispielsweise das erstellte Verzeichnis ein.

 mkdir deploy  
cd deploy

Führen Sie die nachfolgenden Befehle in der Eingabeaufforderung aus, um die Bereitstellung erfolgreich abzuschließen:

 azd init -t azure/gpt-rag  
azd auth login   
azd env refresh  
azd package  
azd deploy

HINWEIS: Verwenden Sie beim Ausführen der azd init ... und azd env refresh denselben Umgebungsnamen, Abonnement und Region, die für die anfängliche Bereitstellung der Infrastruktur verwendet werden.

Erledigt! Die Bereitstellung von Zero Trust ist abgeschlossen.

Empfohlen : App -Authentifizierung hinzufügen. Sehen Sie sich dieses schnelle Tutorial für Schritt-für-Schritt-Anleitung an.

Wie?

Dieser Abschnitt enthält schnelle Anleitungen zum Anpassen, Verwalten und Fehlerbehebung Ihrer Bereitstellung.

Passen Sie Ihre Bereitstellung an

Der Standard -Bereitstellungsprozess legt Azure -Ressourcen ein und bereitet die Beschleunigungskomponenten mit einer Standardkonfiguration bereit. Befolgen Sie die Schritte im Abschnitt Benutzerdefinierte Bereitstellung für weitere Anpassungsoptionen, um die Bereitstellung auf Ihre spezifischen Anforderungen zu vermitteln.

Bereitstellung von Multi-Umwelt

Sobald Sie die GPT-RAG-Lösung erfolgreich als Beweis für das Konzept eingesetzt haben und die Bereitstellung anhand eines ordnungsgemäßen CI/CD-Prozesss formalisieren können, um Ihre Bereitstellung für die Produktion zu beschleunigen, finden Sie die Bereitstellungsleitfäden für Multi-Umwelt für Azure DevOps oder GitHub.

Fehlerbehebung bei Bereitstellungsproblemen

Wenn Sie beim Bereitstellungsprozess auf Fehler stoßen, wenden Sie sich an die Seite Fehlerbehebung, um Anleitungen zur Lösung gemeinsamer Probleme zu erhalten.

Leistung bewerten

Um die Leistung Ihrer Bereitstellung zu bewerten, finden Sie im Testen und Best Practices im Leistungsprüfungshandbuch.

Fragen Sie die Gesprächsgeschichte an

Erfahren Sie, wie Sie Konversationsdaten abfragen und analysieren, indem Sie die im Dokument zum Abfragen und Analyse von Konversationen beschriebenen Schritten befolgen.

Preisgestaltung schätzen

Verstehen Sie die Kostenauswirkungen Ihrer Bereitstellung, indem Sie das Preismodell für eine detaillierte Preisschätzung überprüfen.

Governance verwalten

Stellen Sie sicher, dass Ihr Einsatz eine ordnungsgemäße Governance für die im Governance -Modell angegebenen Richtlinien befolgt.

Enterprise Rag Community

Discord Channel Enterprise Rag - Connected Community

Beitragen

Wir schätzen Ihr Interesse daran, zu diesem Projekt beizutragen! Weitere Informationen zum Beitrag zur Beitragsleistung, einschließlich Informationen zur Sendungsanfragen, finden Sie in der Seite der beitragen.md.md -Seite, die einen Beitrag zur Beitragsrevision (CLA), den Verhaltenskodex und den Vorgang zur Übermittlung von Pull -Anfragen haben.

Vielen Dank für Ihre Unterstützung und Beiträge!

Marken

Dieses Projekt kann Marken oder Logos für Projekte, Produkte oder Dienstleistungen enthalten. Die autorisierte Verwendung von Microsoft -Marken oder Logos unterliegt den Marken- und Markenrichtlinien von Microsoft und muss folgen. Die Verwendung von Microsoft -Marken oder Logos in geänderten Versionen dieses Projekts darf keine Verwirrung verursachen oder Microsoft -Sponsoring implizieren. Jede Verwendung von Marken oder Logos von Drittanbietern unterliegt den Richtlinien dieses Drittanbieters.

Expandieren

Zusätzliche Informationen