Microsoft baru-baru ini membuka sumber sistem pembuatan peningkatan pengambilan berbasis grafik - GraphRAG di situs resminya. Sistem ini secara signifikan meningkatkan kemampuan model besar dalam pencarian, menjawab pertanyaan, ringkasan, dan penalaran dengan membangun grafik pengetahuan entitas. Berbeda dari keterbatasan sistem RAG tradisional yang terlalu mengandalkan pengambilan fragmen teks lokal, GraphRAG dapat menangkap koneksi dan interaksi kompleks dalam kumpulan data untuk mencapai pengambilan global, dan sangat baik dalam memproses kumpulan data berskala besar. Intinya terletak pada dua langkah membangun grafik pengetahuan entitas dan menghasilkan ringkasan komunitas. Hal ini dapat secara efisien mengekstraksi informasi penting melalui ringkasan komunitas dan menghasilkan jawaban yang lebih komprehensif dan akurat. Yang lebih penting adalah permintaan token GraphRAG sangat rendah, yang tidak diragukan lagi merupakan keuntungan biaya yang sangat besar bagi pengembang.

Pintu masuk proyek: https://top.aibase.com/tool/graphrag
Ketika berhadapan dengan sumber data eksternal, sistem RAG tradisional terlalu mengandalkan pengambilan fragmen teks lokal dan gagal menangkap gambaran lengkap dari keseluruhan kumpulan data. GraphRAG membantu model besar menangkap koneksi dan interaksi kompleks dalam teks dengan lebih baik dengan membangun grafik pengetahuan entitas, sehingga mencapai kemampuan pengambilan global.
Inti dari GraphRAG terdiri dari dua langkah: membangun grafik pengetahuan entitas dan menghasilkan ringkasan komunitas. Melalui ringkasan komunitas, GraphRAG mampu mengekstrak informasi yang relevan dari seluruh kumpulan data untuk menghasilkan jawaban yang lebih komprehensif dan akurat. Selain itu, GraphRAG memiliki permintaan token yang sangat rendah, yang berarti dapat membantu pengembang menghemat banyak biaya.
Microsoft melakukan pengujian komprehensif pada GraphRAG pada kumpulan data dengan 1 juta token dan struktur ultra-kompleks. Hasilnya menunjukkan bahwa GraphRAG melampaui metode seperti Naive RAG dalam pengujian komprehensif dan keragaman, serta lebih efektif dalam transkripsi podcast dan data artikel berita. set. Semuanya telah menunjukkan standar yang sangat tinggi dan saat ini merupakan salah satu metode RAG terbaik.
Highlight:
- GraphRAG meningkatkan pencarian, menjawab pertanyaan, peringkasan, penalaran, dan kemampuan lain dari model besar dengan membangun grafik pengetahuan entitas, dan sangat baik dalam memproses kumpulan data berskala besar.
- Inti dari GraphRAG mencakup dua langkah: membangun grafik pengetahuan entitas dan menghasilkan ringkasan komunitas. Ringkasan komunitas digunakan untuk mengekstrak informasi yang relevan dalam kumpulan data untuk menghasilkan jawaban yang lebih komprehensif dan akurat.
- GraphRAG memiliki permintaan token yang sangat rendah dan dapat membantu pengembang menghemat biaya. Ia berkinerja baik dalam pengujian komprehensif dan merupakan salah satu metode RAG terbaik saat ini.
Singkatnya, GraphRAG telah membawa terobosan baru di bidang pembuatan peningkatan pengambilan dengan kinerja luar biasa dalam memproses kumpulan data skala besar dan keunggulan biaya yang signifikan, yang patut mendapat perhatian dan penelitian lebih lanjut. Sumber terbukanya juga memberi pengembang sumber daya dan alat yang berharga.