Pola RAG memungkinkan bisnis untuk menggunakan kemampuan penalaran LLM, menggunakan model yang ada untuk memproses dan menghasilkan respons berdasarkan data baru. Rag memfasilitasi pembaruan data berkala tanpa perlu menyempurnakan, sehingga merampingkan integrasi LLM ke dalam bisnis.
Enterprise Rag Solution Accelerator (GPT-RAG) menawarkan arsitektur kuat yang dirancang untuk penyebaran pola kain tingkat perusahaan. Ini memastikan respons yang membumi dan dibangun di atas keamanan nol-peraturan dan AI yang bertanggung jawab, memastikan ketersediaan, skalabilitas, dan auditabilitas. Ideal untuk organisasi yang beralih dari tahap eksplorasi dan POC ke produksi skala penuh dan MVP.
Lihat Panduan Pengguna & Admin kami untuk pengaturan lengkap dan detail penggunaan.
GPT-RAG mengikuti pendekatan modular, yang terdiri dari tiga komponen, masing-masing dengan fungsi tertentu.
Konsumsi Data - Mengoptimalkan data chunking dan pengindeksan untuk langkah pengambilan kain.
Orchestrator - Mengkoordinasikan aliran untuk mengambil informasi dan menghasilkan respons pengguna. Menawarkan dua opsi: fungsional , menggunakan fungsi kernel semantik (default), dan agen , menggunakan agen autogen. Lihat instruksi penyebaran untuk beralih ke agen.
App Front-end -Menggunakan backend untuk pola front-end untuk menyediakan antarmuka web yang dapat diskalakan dan efisien.
Jika Anda ingin mempelajari lebih lanjut tentang pola kain dan arsitektur GPT-RAG.
Pola Rag: Apa dan Mengapa?
Tinjauan Arsitektur Solusi
Pelajari cara dengan cepat mengatur arsitektur dasar untuk skenario tanpa isolasi jaringan. Klik tautan yang akan dilanjutkan.
Menyebarkan akselerator solusi menggunakan arsitektur nol-trust standar dengan pengaturan solusi yang telah dikonfigurasi sebelumnya. Tidak diperlukan kustomisasi. Klik tautan yang akan dilanjutkan.
Jelajahi opsi untuk menyesuaikan penyebaran akselerator solusi dengan arsitektur nol-trust, menyesuaikan pengaturan solusi dengan kebutuhan Anda. Klik tautan yang akan dilanjutkan.
Bagi mereka yang lebih suka kontrol penuh, ikuti panduan terperinci ini untuk mengatur akselerator solusi secara manual dengan arsitektur nol-trust. Klik tautan yang akan dilanjutkan.
Panduan ini akan memandu Anda melalui proses penyebaran Rag Enterprise. Ada dua opsi penyebaran yang tersedia, arsitektur dasar dan arsitektur nol kepercayaan . Sebelum memulai penyebaran, pastikan Anda telah menyiapkan semua alat dan layanan yang diperlukan sebagaimana diuraikan di bagian Prasyarat .
Prasyarat
** Jika Anda belum pernah membuat sumber daya layanan AZure AI dalam langganan sebelumnya
Untuk demonstrasi cepat atau proyek pembuktian konsep tanpa persyaratan isolasi jaringan, Anda dapat menggunakan akselerator menggunakan arsitektur dasarnya. 
Prosedur penyebaran cukup sederhana, cukup instal prasyarat yang disebutkan di atas dan ikuti empat langkah ini menggunakan Azure Developer CLI (AZD) di terminal:
1 Unduh repositori:
azd init -t azure/gpt-ragCatatan : Tambahkan
-b agenticJika menggunakan orkestra berbasis autogen agen.azd init -t azure/gpt-rag -b agentic
2 Masuk ke Azure:
2. Azure Developer CLI:
azd auth login2.B Azure Cli:
az login3 Mulai membangun infrastruktur dan penyebaran komponen:
azd up4 Tambahkan dokumen sumber ke penyimpanan objek
Unggah dokumen Anda ke folder 'Dokumen' yang terletak di akun penyimpanan. Nama akun ini harus dimulai dengan 'Strag'. Ini adalah akun penyimpanan default, seperti yang ditunjukkan pada gambar sampel di bawah ini.

Selesai! Penyebaran dasar selesai.
Direkomendasikan : Tambahkan otentikasi aplikasi. Tonton tutorial cepat ini untuk panduan langkah demi langkah.
Untuk penyebaran yang lebih aman dan terisolasi, Anda dapat memilih arsitektur nol kepercayaan. Arsitektur ini sangat ideal untuk lingkungan produksi di mana isolasi jaringan dan langkah -langkah keamanan yang ketat sangat dihargai.

Sebelum menggunakan arsitektur nol kepercayaan, pastikan untuk meninjau prasyarat. Penting untuk dicatat bahwa Anda hanya perlu Node.js dan Python untuk bagian kedua dari proses, yang akan dilakukan pada VM yang dibuat selama penyebaran arsitektur ini.
Prosedur penyebaran mirip dengan arsitektur dasar, tetapi dengan beberapa langkah tambahan. Untuk panduan terperinci tentang penyebaran opsi ini, lihat instruksi di bawah ini:
1 Unduh repositori
azd init -t azure/gpt-ragCatatan : Tambahkan
-b agenticJika menggunakan orkestra berbasis autogen agen.azd init -t azure/gpt-rag -b agentic
2 Mengaktifkan isolasi jaringan
azd env set AZURE_NETWORK_ISOLATION true 3 Masuk ke Azure:
2. Azure Developer CLI:
azd auth login2.B Azure Cli:
az login4 Mulai membangun infrastruktur dan penyebaran komponen:
azd provision5 Selanjutnya, Anda akan menggunakan mesin virtual dengan koneksi benteng (dibuat selama langkah 4) untuk melanjutkan penyebaran.
Masuk ke VM yang dibuat dengan pengguna GPTrag dan mengotentikasi dengan kata sandi yang disimpan di KeyVault, mirip dengan gambar di bawah ini:

6 Setelah mengakses Windows, instal PowerShell, karena prasyarat lainnya sudah diinstal pada VM.
7 Buka prompt perintah dan jalankan perintah berikut untuk memperbarui AZD ke versi terbaru:
choco upgrade azd
Setelah memperbarui AZD, cukup tutup dan buka kembali terminal.
8 Buat direktori baru, misalnya, deploy kemudian masukkan direktori yang dibuat.
mkdir deploy
cd deploy
Untuk menyelesaikan prosedur, jalankan perintah selanjutnya dalam prompt perintah untuk berhasil menyelesaikan penyebaran:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
Catatan: Saat menjalankan
azd init ...danazd env refresh, gunakan nama lingkungan, langganan, dan wilayah yang sama yang digunakan dalam penyediaan awal infrastruktur.
Selesai! Penyebaran nol kepercayaan selesai.
Direkomendasikan : Tambahkan otentikasi aplikasi. Tonton tutorial cepat ini untuk panduan langkah demi langkah.
Bagian ini memberikan panduan cepat untuk menyesuaikan, mengelola, dan memecahkan masalah penyebaran Anda.
Proses penyebaran standar mengatur sumber daya Azure dan menyebarkan komponen akselerator dengan konfigurasi standar. Untuk menyesuaikan penyebaran dengan kebutuhan spesifik Anda, ikuti langkah -langkah di bagian penyebaran khusus untuk opsi kustomisasi lebih lanjut.
Setelah Anda berhasil menggunakan solusi GPT-RAG sebagai bukti konsep dan Anda siap untuk memformalkan penyebaran menggunakan proses CI/CD yang tepat untuk mempercepat penyebaran Anda untuk produksi, lihat panduan penyebaran multi-lingkungan untuk Azure DevOps atau Github.
Jika Anda mengalami kesalahan selama proses penempatan, konsultasikan dengan halaman pemecahan masalah untuk panduan tentang penyelesaian masalah umum.
Untuk menilai kinerja penyebaran Anda, lihat panduan pengujian kinerja untuk metodologi pengujian dan praktik terbaik.
Pelajari cara menanya dan menganalisis data percakapan dengan mengikuti langkah -langkah yang diuraikan dalam permintaan dan menganalisis dokumen percakapan.
Memahami implikasi biaya penyebaran Anda dengan meninjau model penetapan harga untuk estimasi harga terperinci.
Pastikan tata kelola yang tepat atas penyebaran Anda dengan mengikuti pedoman yang disediakan dalam model tata kelola.
Kami menghargai minat Anda untuk berkontribusi pada proyek ini! Silakan merujuk ke halaman Contributing.md untuk pedoman terperinci tentang cara berkontribusi, termasuk informasi tentang Perjanjian Lisensi Kontributor (CLA), Kode Etik, dan proses untuk mengirimkan permintaan tarik.
Terima kasih atas dukungan dan kontribusi Anda!
Proyek ini dapat berisi merek dagang atau logo untuk proyek, produk, atau layanan. Penggunaan resmi merek dagang atau logo Microsoft tunduk dan harus mengikuti pedoman merek dagang & merek Microsoft. Penggunaan merek dagang atau logo Microsoft dalam versi yang dimodifikasi dari proyek ini tidak boleh menyebabkan kebingungan atau menyiratkan sponsor Microsoft. Setiap penggunaan merek dagang atau logo pihak ketiga tunduk pada kebijakan pihak ketiga tersebut.