RAG Pattern позволяет предприятиям использовать возможности рассуждений LLMS, используя свои существующие модели для обработки и генерации ответов на основе новых данных. RAG облегчает периодические обновления данных без необходимости точной настройки, тем самым оптимизируя интеграцию LLMS в компании.
Accelerator Enterprise Rag Accelerator (GPT-RAG) предлагает надежную архитектуру, адаптированную для развертывания рисунка тряпичного качества предприятия. Он обеспечивает заземленные ответы и основан на безопасности нулевого доверия и ответственного ИИ, обеспечивающего доступность, масштабируемость и аудит. Идеально подходит для организаций, переходящих от этапов разведки и POC к полномасштабному производству и MVP.
См. Наше руководство пользователя и администратора для полной настройки и сведения о использовании.
GPT-RAG следует модульному подходу, состоящему из трех компонентов, каждый с определенной функцией.
Принимание данных - оптимизирует черту и индексацию данных для шага извлечения тряпки.
Orchestrator - координирует поток, чтобы получить информацию и генерировать ответ пользователя. Он предлагает два варианта: функциональные , с использованием функций семантического ядра (по умолчанию) и агента , используя агенты автогена. См. Инструкции по развертыванию, чтобы переключиться на агент.
App Front-End -использует бэкэнд для фронтального шаблона для обеспечения масштабируемого и эффективного веб-интерфейса.
Если вы хотите узнать больше о Rag Pattern и Architecture GPT-RAG.
Rag Pattern: Что и почему?
Обзор архитектуры решения
Узнайте, как быстро настроить основную архитектуру для сценариев без изоляции сети. Нажмите на ссылку, чтобы продолжить.
Разверните ускоритель решения, используя стандартную архитектуру с нулевым дозом с предварительно сконфигурированными настройками решения. Настройка не требуется. Нажмите на ссылку, чтобы продолжить.
Изучите параметры для настройки развертывания ускорителя решения с помощью архитектуры с нулевым дозом, настраивая настройки решения в соответствии с вашими потребностями. Нажмите на ссылку, чтобы продолжить.
Для тех, кто предпочитает полный контроль, следуйте этому подробному руководству по вручную настройку ускорителя решения с помощью архитектуры с нулевым дозом. Нажмите на ссылку, чтобы продолжить.
Это руководство проведет вас через процесс развертывания Enterprise Rag. Существует два варианта развертывания, базовая архитектура и нулевая архитектура доверия . Перед началом развертывания, пожалуйста, убедитесь, что вы подготовили все необходимые инструменты и услуги, как указано в разделе «Предварительные условия» .
Предварительные условия
** Если вы не создали ресурс Azure AI Service в подписке до
Для быстрых демонстраций или проектов подтверждения концепции без требований к изоляции сети вы можете развернуть акселератор, используя ее основную архитектуру. 
Процедура развертывания довольно проста, просто установите предварительные условия, упомянутые выше, и выполните эти четыре шага, используя Azure Developer CLI (AZD) в терминал:
1 Скачать репозиторий:
azd init -t azure/gpt-ragПримечание . Добавить
-b agenticесли использует агент на основе Autogen Orchestrator.azd init -t azure/gpt-rag -b agentic
2 Войти в Azure:
2. Azure Developer CLI:
azd auth login2.B Azure CLI:
az login3 Начните создавать инфраструктуру и компоненты развертывания:
azd up4 Добавить исходные документы в хранение объектов
Загрузите свои документы в папку «Документы», расположенную в учетной записи. Название этой учетной записи должно начинаться с «Strag». Это учетная запись хранения по умолчанию, как показано на примере изображения ниже.

Сделанный! Основное развертывание завершено.
Рекомендуется : добавить аутентификацию приложения. Посмотрите этот быстрый учебник для пошагового руководства.
Для более безопасных и изолированных развертываний вы можете выбрать архитектуру нулевого доверия. Эта архитектура идеально подходит для производственных сред, где изоляция сети и строгие меры безопасности высоко ценятся.

Прежде чем развернуть архитектуру нулевого доверия, обязательно просмотрите предпосылки. Важно отметить, что вам понадобятся только Node.js и Python для второй части процесса, которая будет выполнена на виртуальной машине, созданной во время развертывания этой архитектуры.
Процедура развертывания аналогична процедуре базовой архитектуры, но с некоторыми дополнительными шагами. Для получения подробного руководства по развертыванию этой опции см. Приведенные ниже инструкции:
1 Скачать репозиторий
azd init -t azure/gpt-ragПримечание . Добавить
-b agenticесли использует агент на основе Autogen Orchestrator.azd init -t azure/gpt-rag -b agentic
2 включить изоляцию сети
azd env set AZURE_NETWORK_ISOLATION true 3 Войдите в Azure:
2. Azure Developer CLI:
azd auth login2.B Azure CLI:
az login4 Начните строить инфраструктуру и компоненты развертывания:
azd provision5 Далее вы будете использовать виртуальную машину с подключением бастионного соединения (созданное во время шага 4) для продолжения развертывания.
Войдите в созданную виртуальную машину с помощью пользовательского GPTRAG и аутентификации с паролем, хранящимся в KeyVault, аналогично рисунку ниже:

6 При доступе к Windows установите PowerShell, поскольку другие предпосылки уже установлены на виртуальной машине.
7 Откройте командную строку и запустите следующую команду, чтобы обновить AZD до последней версии:
choco upgrade azd
После обновления AZD просто закройте и снова откройте терминал.
8 Создайте, например, новый каталог, затем deploy созданный каталог.
mkdir deploy
cd deploy
Чтобы завершить процедуру, выполните последующие команды в командной строке, чтобы успешно завершить развертывание:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
Примечание. При запуске
azd init ...иazd env refreshИспользуйте то же самое название среды, подписку и регион, используемый при первоначальном обеспечении инфраструктуры.
Сделанный! Развертывание нулевого доверия завершено.
Рекомендуется : добавить аутентификацию приложения. Посмотрите этот быстрый учебник для пошагового руководства.
В этом разделе предоставляются быстрые руководства для настройки, управления и устранения неполадок вашего развертывания.
Стандартный процесс развертывания устанавливает ресурсы Azure и развертывает компоненты акселератора со стандартной конфигурацией. Чтобы адаптировать развертывание к вашим конкретным потребностям, выполните шаги в разделе «Пользовательское развертывание» для дальнейших вариантов настройки.
После того, как вы успешно развернули решение GPT-RAG в качестве доказательства концепции, и вы будете готовы формализовать развертывание, используя надлежащий процесс CI/CD для ускорения вашего развертывания в производстве, см. В руководствах по развертыванию с несколькими вариантами окружающей среды либо для Azure DevOps, либо для GitHub.
Если вы столкнетесь с какими -либо ошибками в процессе развертывания, обратитесь к странице устранения неполадок, чтобы узнать, как руководство по решению общих проблем.
Чтобы оценить производительность вашего развертывания, обратитесь к Руководству по тестированию производительности для тестирования методологий и лучших практик.
Узнайте, как запросить и проанализировать данные разговора, выполнив шаги, изложенные в документе «Как спрашивать и проанализировать разговоры».
Понять последствия вашего развертывания, просмотрев модель ценообразования для подробной оценки ценообразования.
Обеспечить надлежащее управление вашим развертыванием, следуя руководящим принципам, представленным в модели управления.
Мы ценим ваш интерес к участию в этом проекте! Пожалуйста, обратитесь на страницу Anforming.md для получения подробных рекомендаций о том, как внести свой вклад, включая информацию о лицензионном соглашении о участнике (CLA), кодексе поведения и процессе подачи запросов на привлечение.
Спасибо за вашу поддержку и вклад!
Этот проект может содержать товарные знаки или логотипы для проектов, продуктов или услуг. Уполномоченное использование товарных знаков или логотипов Microsoft подлежит и должно следовать указаниям Microsoft по товарной марке и брендам. Использование товарных знаков Microsoft или логотипов в модифицированных версиях этого проекта не должно вызывать путаницу или подразумевать спонсорство Microsoft. Любое использование сторонних товарных знаков или логотипов подвержена политике сторонних сторон.