Microsoft hat kürzlich auf seiner offiziellen Website ein graphbasiertes Retrieval-Enhancement-Generierungssystem – GraphRAG – veröffentlicht. Dieses System verbessert die Fähigkeiten großer Modelle bei der Suche, Beantwortung von Fragen, Zusammenfassung und Argumentation durch die Erstellung von Entitätswissensgraphen. Im Gegensatz zu den Einschränkungen herkömmlicher RAG-Systeme, die zu sehr auf das Abrufen lokaler Textfragmente angewiesen sind, kann GraphRAG komplexe Verbindungen und Interaktionen in Datensätzen erfassen, um einen globalen Abruf zu erreichen, und eignet sich besonders gut für die Verarbeitung großer Datensätze. Sein Kern liegt in den beiden Schritten der Erstellung eines Entitätswissensgraphen und der Generierung von Community-Zusammenfassungen. Durch Community-Zusammenfassungen können wichtige Informationen effizient extrahiert und umfassendere und genauere Antworten generiert werden. Bemerkenswerter ist, dass die Nachfrage von GraphRAG nach Token äußerst gering ist, was zweifellos einen enormen Kostenvorteil für Entwickler darstellt.

Projekteingang: https://top.aibase.com/tool/graphrag
Beim Umgang mit externen Datenquellen verlassen sich herkömmliche RAG-Systeme zu sehr auf den Abruf lokaler Textfragmente und können nicht das vollständige Bild des gesamten Datensatzes erfassen. GraphRAG hilft großen Modellen, komplexe Verbindungen und Interaktionen im Text besser zu erfassen, indem es Entitätswissensgraphen erstellt und so globale Abruffunktionen erreicht.
Der Kern von GraphRAG besteht aus zwei Schritten: dem Erstellen eines Entitätswissensgraphen und dem Generieren von Community-Zusammenfassungen. Durch die Community-Zusammenfassung ist GraphRAG in der Lage, relevante Informationen aus dem gesamten Datensatz zu extrahieren, um umfassendere und genauere Antworten zu generieren. Darüber hinaus hat GraphRAG eine sehr geringe Nachfrage nach Token, was bedeutet, dass es Entwicklern helfen kann, viel Kosten zu sparen.
Microsoft führte einen umfassenden Test von GraphRAG an einem Datensatz mit 1 Million Token und einer äußerst komplexen Struktur durch. Die Ergebnisse zeigten, dass GraphRAG Methoden wie Naive RAG bei Vollständigkeits- und Diversitätstests übertraf und bei Podcast-Transkription und Nachrichtenartikeldaten effektiver war Sie alle haben extrem hohe Standards gezeigt und gehören derzeit zu den besten RAG-Methoden.
Höhepunkte:
- GraphRAG verbessert die Suche, Beantwortung von Fragen, Zusammenfassung, Argumentation und andere Fähigkeiten großer Modelle durch die Erstellung von Entitätswissensgraphen und eignet sich besonders gut für die Verarbeitung großer Datensätze.
- Der Kern von GraphRAG besteht aus zwei Schritten: dem Erstellen eines Entitätswissensgraphen und dem Generieren von Community-Zusammenfassungen, mit denen relevante Informationen aus dem Datensatz extrahiert werden, um umfassendere und genauere Antworten zu generieren.
– GraphRAG hat eine sehr geringe Nachfrage nach Token und kann Entwicklern helfen, Kosten zu sparen. Es schneidet in umfangreichen Tests gut ab und ist derzeit eine der besten RAG-Methoden.
Zusammenfassend lässt sich sagen, dass GraphRAG mit seiner hervorragenden Leistung bei der Verarbeitung großer Datensätze und erheblichen Kostenvorteilen neue Durchbrüche auf dem Gebiet der Generierung von Retrieval-Enhancements gebracht hat, was Aufmerksamkeit und weitere Forschung verdient. Seine Open Source stellt Entwicklern außerdem wertvolle Ressourcen und Tools zur Verfügung.