doc rag harness herunterladen - doc rag harness -Quellcode Download

doc rag harness

Anderer Quellcode

1.0.0

Herunterladen

Dokumentabruf Augmented Generation (RAG) -Gab

Das Gebiet der erweiterten Erzeugung von Abruf entwickelt sich schnell. Es gibt viele verschiedene Möglichkeiten, das Abruf umzusetzen. Einige Leute verwenden Emetten- und Vektor -Datenbanken, andere verwenden semantische Diagramme. Es gibt also verschiedene Designs und auch unterschiedliche Aufgaben, und es ist wichtig, ein Design zu einer Aufgabe ¹ anzupassen.

Das Ziel dieses Kabelbaums, Definitionen, Abstraktionen und Bausteine für Sammeldefinitionen zu erstellen, um ein bestimmtes Abrufdesign zu verstehen, Benchmarking, Vergleich und Auswahl eines spezifischen Abrufdesigns zu unterstützen, das am besten zu einer aufgeschlossenen Aufgabe passt.

Der Kabelbaum soll einem Technology + Technology Compatibility Kit (TCK) etwas ähnlich sein, um:

Java/EMF ECORE -Modell/API für Dokumentenspeicher und Abruf einschließlich "Design Provider Interface", die von Kandidatenentwürfen implementiert werden soll
Testen von Framework, um zu bewerten, wie unterschiedliche Designs eine bestimmte Aufgabe ausführen.

Java wurde als dominierende Technologie in der Enterprise -Welt mit reicher Ausdruckskraft der Sprache und einem großen reifen Ökosystem ausgewählt. EMF Ecore wurde ausgewählt, weil es Fähigkeiten gibt:

Laden/Speichern von Modellen von/nach Yaml, XMI und Binärdateien sowie Datenbanken
Generieren Sie HTML -Dokumentation aus Modellen und Metamodellen
Werkzeugunterstützung für den Bau von Zuschauern und Redakteuren - Baum, Diagramm, Text; Eclipse IDE und Webbrowser

Diese Seite bietet eine Einführung in Kernkonzepte und beschreibt mehrere Anwendungsfälle (Aufgaben) und Designs (Alternativen).

Konzepte

Das folgende Diagramm beschreibt die Gurtstruktur und den Kontext:

Überblick

Die folgenden Abschnitte bieten Definitionen und Umrissaufgaben-/Designabmessungen für jede Definition. Das Metamodel erfasst einige der Definitionen als Modellelemente und erläutert sie in Merkmale, Operationen und Unterklassen.

Dokumentieren

Das Dokument ist eine erinnerte Darstellung von Gedanken oder Informationen. Für die Zwecke dieses Kabelbaumdokumente:

Werden in einer Dokumentquelle/einem Repository gespeichert (wie Bücher in einer Bibliothek)
Kann kategorisiert werden und Kategorien können verschachtelt werden (z. B. Buchgenre - Fiktion / Sci -Fi)
Kann eine interne Struktur haben (z. B. Volumen, Kapitel, Abschnitt, Absatz, Wort)
Kann verschiedene Arten von Inhalten enthalten - Text, Bild, Video, Audio, Strukturen wie Listen und Tabellen
Kann auf andere Dokumente oder externe Entitäten hinweisen

"Physische" Implementierungen:

Textdatei
PDF. In Java kann mit Apache PDFBox geladen werden
OCR führt beispielsweise Json
MS Office -Dokumente - In Java können mit Apache POI geladen werden. MS Excel -Dateien können als ECORE -Modell mit Nasdanika Excel -Modell geladen werden
HTML -Dokumente/Seiten (Subtyp des Textes)

"Logische" Implementierungen:

Für PDF/OCR - einen Scan eines Geschäftsdokuments. Zum Beispiel ein Fax einer schnellen Nachricht. In diesem Fall:
- Header und Fußzeile, die vom Fax hinzugefügt werden, kann als irrelevant entfernt werden
- Seitenkörper können in eine schnelle spezifische Struktur analysiert werden, z. B. MT 700
- Einbettungsdings können für Körpern oder Absätze oder Klauseln für einige Elemente erstellt werden. Klauselnummern können vom Text ausgeschlossen werden. Etwas ähnlich wie bei Wikipedia -Artikeln Einbettungen, bei denen Einbettungen für Passagen ohne Header berechnet werden.
Für HTML - eine Dokumentationsseite. Sagen Sie, Spring Expression Language (SPEL) In diesem Fall Header, linke Navigation, rechter Seitenleiste und Fußzeile könnten als nicht relevant oder in jeweils logische Dokumentfunktionen verworfen werden, die möglicherweise ignoriert werden. Breadcrumb kann zur Kategorisierung verwendet werden.
Für Textdateien - abhängig vom Inhaltstyp. Z. B. pom.xml kann in ein Projektobjektmodell geladen werden. Die Java -Datei kann in einen Syntaxbaum oder einen Diagramm mit aufgelöstem Typ/Feld/Methodenreferenzen geladen werden.

Dokumentlader

Konvertiert eine Dokumentdarstellung in eine andere. ZB PDF oder OCR JSON an ein Objektmodell einer Swift MT 700 -Nachricht.

Dokumente Quelle

Speicherung von Dokumenten in einem bestimmten Format oder Formaten. ZB ein Dateisystem mit PDF -Dokumenten. Dokumentequellen können umgewandelt/angepasst werden. Eines der Beispiele für die Dokumentquelle ist ein Git -Commit. Das Nasdanika Gitlab -Modell kann verwendet werden, um das Laden von Dokumenten aus GitLab zu implementieren.

Dokument -Repository

Eine Sammlung von Dokumenten, die Speicher- und Abruffunktionen bieten. Die primäre Schnittstelle des DPI (siehe unten), die von Designs implementiert werden soll.

Beim Speichern eines Dokuments kann das Repository Aufgaben wie die Bilderkennung ausführen.

Es kann mehrere Abrufmodalitäten geben, wie z. B.:

Keyword -Suche
Semantische Suche
Zusammenfassung - Suchen und Zusammenfassen von Top X -Ergebnissen

Repositorys können aus anderen Repositorys und Datenladern zusammengestellt werden. ZB ein PDF -Repository kann aus einem PDF -> Objektmodelldatenlader und einem Objektmodell -Repository zusammengestellt werden. Dokument -Repositories müssen auch das Quelldokument möglicherweise nicht speichern/neu erstellen - sie können es referenzieren und aus einem Dokumentgeschäft abrufen - das Original, aus dem das Dokument geladen wurde, oder auf einen repository -spezifischen Dokumentstore.

Es kann auch möglich sein, verschiedene Entwürfe von Repositories zu bestimmen. Zum Beispiel ein Repository, das die Keyword -Suche und ein Repository unterstützt, das die semantische Suche unterstützt. In diesem Fall wären die Ergebnisse der Keyword -Suchrepository -Abfragen erforderlich, aber nicht ausreichend und können verwendet werden, um die Ergebnisse des semantischen Suchrepositorys zu validieren.

Benutzer / Web -Benutzeroberfläche

Benutzer fragen ein Dokument -Repository über die Web -Benutzeroberfläche ab. Sie können dies als Teil ihrer Jobfunktion oder um die Abfragefunktionalität eines bestimmten Designs zu bewerten und Feedback zu geben. Diese beiden Modalitäten können kombiniert werden - Benutzer verwenden möglicherweise nur die "Champion" -Anfrage -Engine/-design, z. B. die Suche nach Schlüsselwörtern oder auch "Challenger" -Motoren/-designs.

Die Web -Benutzeroberfläche kann den Benutzerkontext wie Rolle/Position in der Organisation erfassen und als Teil einer Abfrage an das Design weitergeben.

Sponsor

Eine Partei, die sich für die Verbesserung der Eigenschaften der Benutzerarbeit interessiert, z. B. die Produktivität durch die Verwendung von Dokumentenab Abruf Augmented Generation.

Sponsoren müssen mehrere Kriterien ausgleichen, um die "Verlustfunktion" zu minimieren:

Wiederholungsgeschwindigkeit
Genauigkeit
Vollständigkeit
Kosten wie Ausführungskosten, Lizenzkosten usw.

Design

Das Design ist eine Instanziierung/Verkörperung von Technologien und deren Konfigurationsparametern.

Designabmessungen

Entwurfsvariationspunkte - Was kann in verschiedenen Ausführungsformen/Instanziationen und Wertenquellen geändert werden. Zum Beispiel:

Anzahl der Einbettungsdimensionen
ML -Modell
Modelltemperatur
Vektordatenbank
Vektor -Datenbankversion

Designabmessungen können einen Baum oder genauer gesagt ein gerichteter Diagramm bilden. EG -Vektor -Datenbankversionen wären Knoten unter einem Knoten für eine bestimmte Vektordatenbank.

Konstruktionsanbieterschnittstelle

DPI -Designanbieter Interface (DPI) wird den Kabelbaum aus einer bestimmten Design -Implementierung abstrahiert. Es handelt sich um eine Reihe von Schnittstellen und abstrakten Klassen, die das Design implementieren muss. ZB DocumentRepository -Schnittstelle. DPI ist in Java/Ecore definiert und kann Adapter für verschiedene Technologien zur Verfügung stellen. Insbesondere:

Ruhe -API
Sprachbindungen und ein Läufer, der die Rest -API implementiert und Komponenten aufruft, die die Sprachbindungsschnittstelle implementieren. Zum Beispiel kann eine Python -Bindung mit Flask implementiert werden
Frameworkbindungen/Implementierungen unter Sprachbindungen oder direkt unter der DPI in Java. ZB unter der Python -Bindung kann es eine Langchain -Bindung geben, und unter Java könnte es eine offene Bindung geben

Aufgabe

Die Aufgabe ist eine spezifische Verwendung des Dokumentenabrufs. Beispielsweise semantische Suche in organisationspezifischen technischen Dokumentation "Wie stelle ich einen Spring Microservice für AKs bereit?".

Testdatensatz

Eine Sammlung von Testdokumenten, Abfragen und Bewertern von Antworten.

Läufereingänge

Eine Sammlung von Testdatensatz- / Designkombinationen, die vom Testläufer ausgeführt werden sollen.

Testläufer

Liest Eingänge
Instantiates Testdatensätze und -designs
Laden Sie Dokumente aus einem Testdatensatz in ein Design
Führt Abfragen aus und bewertet Antworten. Reaktionsbewerter können Feedback zum Design geben
Speichert die Testergebnisse für die weitere Analyse und Berichterstellung

Der Testläufer kann je nach Eingängen nur Teile der obigen Schritte ausführen. Zum Beispiel:

Möglicherweise gibt es bereits ein Design mit vorbelasteten Dokumenten, und der Testläufer führt nur den Abfrageteil aus
Oder der Testdatensatz kann nur Dokumente enthalten, jedoch keine Abfragen und Antwortbewerter, da Abfragen und Antworten von Benutzern über die Web -Benutzeroberfläche bereitgestellt werden sollen
Testläufer kann Dokumente in das Design laden und als neues Design speichern. ZB erstellen Sie einen Container aus einem Bild, laden Sie Dokumente und stoppen Sie den Container und erstellen Sie ein Bild aus dem Container.
In ähnlicher Weise kann der Testläufer einen Testdatensatz einnehmen, ihn mit dem von Benutzer bereitgestellten Feedback kombinieren und einen neuen Testdatensatz erstellen und erstellen.

Testläufe können über mehrere Agenten/Maschinen verteilt werden.

Testergebnisse und Benutzerfeedback

Speicherung von Testergebnissen und Benutzerfeedback. Testergebnisse und Benutzerfeedback müssen Testdatensätze und -designs referenzieren. Daher handelt es sich im Wesentlichen um ein Gurtmetadaten -Repository mit Entwurfsdefinitionsbäumen/-grafiken, Testdatensatzdefinitionen und Ergebnissen von Testläufen.

Bericht Generator

Generiert einen Bericht. Der Bericht könnte im HTML -Format mit Visualisierungen sein. Ein mögliches Berichtsformat:

Linke Panel mit dem Designbaum, dem Aufgabenbaum und den Testdatensätzen für Aufgaben. Es kann auch einen "Tech -Stack -Baum" beinhalten - kategorisierte Designbausteine. Zum Beispiel ein Baum der Vektor -Datenbanken, deren Versionen und Konfigurationen. Wenn das linke Feld zu laut wird, können einige der Artikel in die Navigationsleiste verschoben werden.
Inhaltspanel - Dokumentation für das ausgewählte Element. Z.B
- Homepage - Eine Zusammenfassung der durchgeführten Tests: filterbare sortierbare Tabelle mit Design-/Testpermutationen (für relativ kleine Räume), Visualisierungen, z. B. 3D -Streuung. Es kann auch einen Design -Assistenten enthalten, um Designs zu erstellen, indem Fragen beantwortet und ein getestetes Design ausgewählt werden, das am besten zu den Antworten passt.
- Designseite - Konfiguration, Tests und Ergebnisse - Tabelle, Visualisierungen
- Aufgabenseite - Beschreibung, Tests, Designs, Visualisierungen. Es kann eine Aggregations -Web -Benutzeroberfläche veranstalten, die Antworten aus allen Designs für diese Aufgabe sammelt und Benutzern die Antworten von alternativen Designs vergleichen kann. Eine Option zum Vergleich ist ein paarweisen Vergleich möglicherweise, ohne zu schwelgen, aus welchem Design eine bestimmte Antwort stammt.
- Baustein (z. B. Vektordatenbank, seine Version, Konfiguration) - Beschreibung, Entwürfe, die sie verwenden.

Der Bericht kann Links zur Web -Benutzeroberfläche oder sogar "Host" der Web -Benutzeroberfläche enthalten, wenn sie als Einzelseiten -Anwendung (SPA) mit beispielsweise React oder Vue.js/Bootstrapvue implementiert ist

Gemeinschaft

Parteien, die zum Geschirr, Designs und Testdatensätzen beitragen. Community -Mitglieder spielen möglicherweise unterschiedliche Rollen in verschiedenen Komponenten.

--- Arbeit in Arbeit ----

Aufgaben

Dieser Abschnitt beschreibt mehrere Aufgaben (Anwendungsfälle) für die Abrufen der Augmented -Generation und -Suche im Allgemeinen.

Abmessungen:

Anzahl der Dokumente
Anzahl der Benutzer
Frequenz von Änderungen
Privatsphäre
Risiko - Fehlerkosten

Technische Dokumentation

Beispiel - Technologiefunktion in einem großen Unternehmen:

Mehrere Ebenen:
- Corporate Binds Enterprise-wide Technologieauswahl (z. B. Java/Spring, Maven-Komponenten) bietet unternehmensweite gemeinsame Bausteine (z. B. eine Bibliothek von Bootstrap-Komponenten) und andere Technologien (z. B. eine Build-Pipeline)
- Segment - Technologische Auswahlmöglichkeiten, z. B. Version von Java, fügen Sie segmentspezifische Wege hinzu, um Dinge zusätzlich zu den Unternehmensrichtlinien zu tun (die wiederum auf den Richtlinien und Dokumentation der Branche/Lieferanten -Technologie aufbauen). Kann Bausteine auf Segmentebene einführen.
- Fähigkeit/Team - Verengt die Technologieauswahl noch weiter und verfeinert ihre Verwendung. Kann Bausteine für Fähigkeiten/Teamebene einführen, z. B. Widget -Bibliotheken.

Für jedes der oben genannten gibt es eine zeitliche Dimension - Tech -Stapel -Updates oben, veröffentlicht unten. Siehe Togaf Architecture Landscape für eine Visualisierung.

In einer solchen Umgebung benötigen Benutzer eine Abruflösung, mit der Dokumente abgerufen werden können, die für die Position und Rolle des Benutzers im Unternehmen und die Anstrengungen, denen sie zugewiesen werden, spezifisch sind. Zum Beispiel, an dem ein Java -Entwickler arbeitet, beispielsweise die aktuelle Veröffentlichung benötigt möglicherweise Informationen über Java 17. Wenn derselbe Entwickler zu einer künftigen Veröffentlichung zugewiesen wird, benötigt sie möglicherweise Informationen darüber, über die sie mit Technologien wie Kubernetes und Azure -Ak -AKs arbeiten. Wenn sie mit technologischen Dokumentation weitgehend nutzlos sind, können Sie bei allgemeinen Informationen über allgemeine Informationen verfügen.

Anzahl der Dokumente: Zehntausende
Anzahl der Benutzer: Hunderte bis Tausende
Häufigkeit von Änderungen: niedrig (z. B. monatlich) bis moderat (mehrmals im Monat)
Privatsphäre: intern
Risiko: niedrig

Verfahren

Abmessungen:

Anzahl der Dokumente: niedrige Tausende
Anzahl der Benutzer: Hunderte bis Tausende
Frequenz der Änderungen: niedrig (z. B. monatlich)
Privatsphäre: intern, eingeschränkt, vertraulich
Risiko: mittel bis hoch

Betriebsdokumente

Abmessungen:

Anzahl der Dokumente: möglicherweise Millionen
Anzahl der Benutzer: Hunderte bis Tausende
Häufigkeit von Veränderungen: hoch (täglich)
Privatsphäre: Vertrauliche, persönliche Informationen - PII, PHI, PCI
Risiko: Hoch

Entwürfe

Einbettung, Vektordatenbanken, LLMs

Todo. Laut Brancheninformationen zielt eine sehr große Anzahl von Dokumenten ab - entspricht dem Anwendungsfall der Betriebsdokumente

Grafiken

Todo. Möglicherweise ist besser für eine geringere Anzahl von Dokumenten (Verfahren) - sie passen alle in den Speicher und Suchvorgänge können in semantischen Graphen durchgeführt werden. Im Vektor -Datenbankfall besteht eine Möglichkeit zum Erstellen von Indizes darin, Diagramme zu verwenden - hierarchische navigable kleine Welt (HNSW)

Polymorphe Graphen

Todo. Möglicherweise passt gut für den Anwendungsfall für technische Dokumentation:

Das Unternehmen erstellt ein Wissensgraphen (Modell) für die Auswahl der Enterprise Technology. Es kann mehrere Modelle geben - Basislinie, zukünftige Veröffentlichungen
Segmente nehmen die Enterprise -Diagramme/-modelle und haben sich anpassen - das Konzept ähnlich wie die Vererbung in objektorientierten Sprachen wie Java und auch ähnlich wie Layers in Docker
Fähigkeiten/Teams können es weiter ausführen

Dieser Prozess führt zu einer großen Anzahl (Hunderten) relativ kleiner Diagramme/Modelle (Wissensbasis) mit Zehntausenden von Dokumenten.