Скачать GPT RAG скачать - скачать исходный код GPT RAG

GPT RAG

Другой исходный код

1.0.0

Скачать

RAG Pattern позволяет предприятиям использовать возможности рассуждений LLMS, используя свои существующие модели для обработки и генерации ответов на основе новых данных. RAG облегчает периодические обновления данных без необходимости точной настройки, тем самым оптимизируя интеграцию LLMS в компании.

Accelerator Enterprise Rag Accelerator (GPT-RAG) предлагает надежную архитектуру, адаптированную для развертывания рисунка тряпичного качества предприятия. Он обеспечивает заземленные ответы и основан на безопасности нулевого доверия и ответственного ИИ, обеспечивающего доступность, масштабируемость и аудит. Идеально подходит для организаций, переходящих от этапов разведки и POC к полномасштабному производству и MVP.

См. Наше руководство пользователя и администратора для полной настройки и сведения о использовании.

Прикладные компоненты

GPT-RAG следует модульному подходу, состоящему из трех компонентов, каждый с определенной функцией.

Принимание данных - оптимизирует черту и индексацию данных для шага извлечения тряпки.
Orchestrator - координирует поток, чтобы получить информацию и генерировать ответ пользователя. Он предлагает два варианта: функциональные , с использованием функций семантического ядра (по умолчанию) и агента , используя агенты автогена. См. Инструкции по развертыванию, чтобы переключиться на агент.
App Front-End -использует бэкэнд для фронтального шаблона для обеспечения масштабируемого и эффективного веб-интерфейса.

Концепции

Если вы хотите узнать больше о Rag Pattern и Architecture GPT-RAG.

Rag Pattern: Что и почему?
Обзор архитектуры решения

Enterprise Rag+resmpting Engineering+MineTuning+Train (видео на испанском)

Руководство по настройке

Основное развертывание архитектуры: для быстрых демонстраций без сетевой изоляции

Узнайте, как быстро настроить основную архитектуру для сценариев без изоляции сети. Нажмите на ссылку, чтобы продолжить.

Стандартное развертывание архитектуры с нулевым дозом: самый быстрый вариант развертывания с нулевым дозом ⚡

Разверните ускоритель решения, используя стандартную архитектуру с нулевым дозом с предварительно сконфигурированными настройками решения. Настройка не требуется. Нажмите на ссылку, чтобы продолжить.

Пользовательская настройка архитектуры с нулевым дозом: большинство используемых

Изучите параметры для настройки развертывания ускорителя решения с помощью архитектуры с нулевым дозом, настраивая настройки решения в соответствии с вашими потребностями. Нажмите на ссылку, чтобы продолжить.

Пошаговая ручная настройка: Архитектура нулевого достопримечательности: практическое подход **

Для тех, кто предпочитает полный контроль, следуйте этому подробному руководству по вручную настройку ускорителя решения с помощью архитектуры с нулевым дозом. Нажмите на ссылку, чтобы продолжить.

Начиная

Это руководство проведет вас через процесс развертывания Enterprise Rag. Существует два варианта развертывания, базовая архитектура и нулевая архитектура доверия . Перед началом развертывания, пожалуйста, убедитесь, что вы подготовили все необходимые инструменты и услуги, как указано в разделе «Предварительные условия» .

Предварительные условия

Azure Developer CLI: Скачать AZD для Windows, другие ОС.
PowerShell 7+ с модулем AZ (только Windows): PowerShell, AZ Module
Git: скачать git
Node.js 16+ Windows/Mac Linux/WSL
Python 3.11: скачать Python
Инициировать создание услуг Azure AI и согласиться с ответственными терминами ИИ **

** Если вы не создали ресурс Azure AI Service в подписке до

Основное развертывание архитектуры

Для быстрых демонстраций или проектов подтверждения концепции без требований к изоляции сети вы можете развернуть акселератор, используя ее основную архитектуру. Основная архитектура

Процедура развертывания довольно проста, просто установите предварительные условия, упомянутые выше, и выполните эти четыре шага, используя Azure Developer CLI (AZD) в терминал:

1 Скачать репозиторий:

azd init -t azure/gpt-rag

Примечание . Добавить -b agentic если использует агент на основе Autogen Orchestrator.
azd init -t azure/gpt-rag -b agentic

2 Войти в Azure:

2. Azure Developer CLI:

azd auth login

2.B Azure CLI:

az login

3 Начните создавать инфраструктуру и компоненты развертывания:

azd up

4 Добавить исходные документы в хранение объектов

Загрузите свои документы в папку «Документы», расположенную в учетной записи. Название этой учетной записи должно начинаться с «Strag». Это учетная запись хранения по умолчанию, как показано на примере изображения ниже.

storage_sample

Сделанный! Основное развертывание завершено.

Рекомендуется : добавить аутентификацию приложения. Посмотрите этот быстрый учебник для пошагового руководства.

Развертывание архитектуры нулевого доверия

Для более безопасных и изолированных развертываний вы можете выбрать архитектуру нулевого доверия. Эта архитектура идеально подходит для производственных сред, где изоляция сети и строгие меры безопасности высоко ценятся.

Архитектура нулевого доверия

Прежде чем развернуть архитектуру нулевого доверия, обязательно просмотрите предпосылки. Важно отметить, что вам понадобятся только Node.js и Python для второй части процесса, которая будет выполнена на виртуальной машине, созданной во время развертывания этой архитектуры.

Процедура развертывания аналогична процедуре базовой архитектуры, но с некоторыми дополнительными шагами. Для получения подробного руководства по развертыванию этой опции см. Приведенные ниже инструкции:

1 Скачать репозиторий

azd init -t azure/gpt-rag

Примечание . Добавить -b agentic если использует агент на основе Autogen Orchestrator.
azd init -t azure/gpt-rag -b agentic

2 включить изоляцию сети

azd env set AZURE_NETWORK_ISOLATION true

3 Войдите в Azure:

2. Azure Developer CLI:

azd auth login

2.B Azure CLI:

az login

4 Начните строить инфраструктуру и компоненты развертывания:

azd provision

5 Далее вы будете использовать виртуальную машину с подключением бастионного соединения (созданное во время шага 4) для продолжения развертывания.

Войдите в созданную виртуальную машину с помощью пользовательского GPTRAG и аутентификации с паролем, хранящимся в KeyVault, аналогично рисунку ниже:

Keyvault login

6 При доступе к Windows установите PowerShell, поскольку другие предпосылки уже установлены на виртуальной машине.

7 Откройте командную строку и запустите следующую команду, чтобы обновить AZD до последней версии:

 choco upgrade azd

После обновления AZD просто закройте и снова откройте терминал.

8 Создайте, например, новый каталог, затем deploy созданный каталог.

 mkdir deploy  
cd deploy

Чтобы завершить процедуру, выполните последующие команды в командной строке, чтобы успешно завершить развертывание:

 azd init -t azure/gpt-rag  
azd auth login   
azd env refresh  
azd package  
azd deploy

Примечание. При запуске azd init ... и azd env refresh Используйте то же самое название среды, подписку и регион, используемый при первоначальном обеспечении инфраструктуры.

Сделанный! Развертывание нулевого доверия завершено.

Рекомендуется : добавить аутентификацию приложения. Посмотрите этот быстрый учебник для пошагового руководства.

Как?

В этом разделе предоставляются быстрые руководства для настройки, управления и устранения неполадок вашего развертывания.

Настройте свое развертывание

Стандартный процесс развертывания устанавливает ресурсы Azure и развертывает компоненты акселератора со стандартной конфигурацией. Чтобы адаптировать развертывание к вашим конкретным потребностям, выполните шаги в разделе «Пользовательское развертывание» для дальнейших вариантов настройки.

Развертывание многопользоватодов

После того, как вы успешно развернули решение GPT-RAG в качестве доказательства концепции, и вы будете готовы формализовать развертывание, используя надлежащий процесс CI/CD для ускорения вашего развертывания в производстве, см. В руководствах по развертыванию с несколькими вариантами окружающей среды либо для Azure DevOps, либо для GitHub.

Устранение неполадок. Вопросы развертывания

Если вы столкнетесь с какими -либо ошибками в процессе развертывания, обратитесь к странице устранения неполадок, чтобы узнать, как руководство по решению общих проблем.

Оценить производительность

Чтобы оценить производительность вашего развертывания, обратитесь к Руководству по тестированию производительности для тестирования методологий и лучших практик.

Запросить историю разговоров

Узнайте, как запросить и проанализировать данные разговора, выполнив шаги, изложенные в документе «Как спрашивать и проанализировать разговоры».

Оценка цен

Понять последствия вашего развертывания, просмотрев модель ценообразования для подробной оценки ценообразования.

Управлять управлением

Обеспечить надлежащее управление вашим развертыванием, следуя руководящим принципам, представленным в модели управления.

Enterprise Rag Community

Discord Channel Enterprise Rag - Connected Community

Внося

Мы ценим ваш интерес к участию в этом проекте! Пожалуйста, обратитесь на страницу Anforming.md для получения подробных рекомендаций о том, как внести свой вклад, включая информацию о лицензионном соглашении о участнике (CLA), кодексе поведения и процессе подачи запросов на привлечение.

Спасибо за вашу поддержку и вклад!

Товарные знаки

Этот проект может содержать товарные знаки или логотипы для проектов, продуктов или услуг. Уполномоченное использование товарных знаков или логотипов Microsoft подлежит и должно следовать указаниям Microsoft по товарной марке и брендам. Использование товарных знаков Microsoft или логотипов в модифицированных версиях этого проекта не должно вызывать путаницу или подразумевать спонсорство Microsoft. Любое использование сторонних товарных знаков или логотипов подвержена политике сторонних сторон.

Расширять

Дополнительная информация