O padrão RAG permite que as empresas usem os recursos de raciocínio do LLMS, usando seus modelos existentes para processar e gerar respostas com base em novos dados. O RAG facilita as atualizações periódicas de dados sem a necessidade de ajuste fino, simplificando assim a integração do LLMS nas empresas.
O Enterprise Rag Solution Accelerator (GPT-RAG) oferece uma arquitetura robusta adaptada para a implantação de grau corporativo do padrão de pano. Ele garante respostas fundamentadas e é construído sobre segurança zero e responsável, garantindo disponibilidade, escalabilidade e auditabilidade. Ideal para as organizações que fazem a transição das etapas de exploração e POC para a produção em escala e MVPs em larga escala.
Consulte nosso Guia de Usuário e Admin para obter detalhes completos de configuração e uso.
O GPT-RAG segue uma abordagem modular, consistindo em três componentes, cada um com uma função específica.
Ingestão de dados - otimiza o chunking e a indexação de dados para a etapa de recuperação do RAG.
Orchestrator - coordena o fluxo para recuperar informações e gerar uma resposta do usuário. Oferece duas opções: funcional , usando funções semânticas do kernel (padrão) e agente , usando agentes de autogênio. Consulte Instruções de implantação para mudar para o Agentic.
Frente-final do aplicativo -usa o back-end para o padrão front-end para fornecer uma interface da Web escalável e eficiente.
Se você quiser aprender mais sobre o padrão de pano e a arquitetura GPT-RAG.
Padrão de pano: O que e por quê?
Visão geral da arquitetura da solução
Aprenda a configurar rapidamente a arquitetura básica para cenários sem isolamento da rede. Clique no link para prosseguir.
Implante o acelerador da solução usando a arquitetura padrão de trust zero com configurações de solução pré-configuradas. Nenhuma personalização necessária. Clique no link para prosseguir.
Explore as opções para personalizar a implantação do acelerador da solução com uma arquitetura de trust zero, ajustando as configurações da solução para suas necessidades. Clique no link para prosseguir.
Para aqueles que preferem o controle completo, siga este guia detalhado para configurar manualmente a solução Accelerator com uma arquitetura zero-trust. Clique no link para prosseguir.
Este guia o levará pelo processo de implantação do Enterprise Rag. Existem duas opções de implantação disponíveis, arquitetura básica e arquitetura Zero Trust . Antes de iniciar a implantação, verifique se você preparou todas as ferramentas e serviços necessários, conforme descrito na seção Pré-requisitos .
Pré-requisitos
** Se você não criou um recurso de serviço Azure AI na assinatura antes
Para demonstrações rápidas ou projetos de prova de conceito sem requisitos de isolamento de rede, você pode implantar o acelerador usando sua arquitetura básica. 
O procedimento de implantação é bastante simples, basta instalar os pré -requisitos mencionados acima e seguir estas quatro etapas usando o desenvolvedor do Azure CLI (AZD) em um terminal:
1 Faça o download do repositório:
azd init -t azure/gpt-ragNOTA : Adicione
-b agenticse estiver usando o orquestrador baseado em autogênio Agentic.azd init -t azure/gpt-rag -b agentic
2 Faça login no Azure:
2.Um desenvolvedor do Azure CLI:
azd auth login2.B CLI do Azure:
az login3 Comece a construir a implantação de infraestrutura e componentes:
azd up4 Adicione documentos de origem ao armazenamento de objetos
Carregue seus documentos para a pasta 'documentos' localizada na conta de armazenamento. O nome desta conta deve começar com 'Stag'. Esta é a conta de armazenamento padrão, conforme mostrado na imagem de amostra abaixo.

Feito! A implantação básica é concluída.
Recomendado : Adicione a autenticação do aplicativo. Assista a este tutorial rápido para orientações passo a passo.
Para implantações mais seguras e isoladas, você pode optar pela arquitetura Zero Trust. Essa arquitetura é ideal para ambientes de produção em que o isolamento da rede e medidas rigorosas de segurança são altamente valorizadas.

Antes de implantar a arquitetura Zero Trust, verifique os pré -requisitos. É importante observar que você precisará apenas do Node.js e Python para a segunda parte do processo, que será realizada na VM criada durante a implantação dessa arquitetura.
O procedimento de implantação é semelhante ao da arquitetura básica, mas com algumas etapas adicionais. Para obter um guia detalhado sobre a implantação desta opção, consulte as instruções abaixo:
1 Faça o download do repositório
azd init -t azure/gpt-ragNOTA : Adicione
-b agenticse estiver usando o orquestrador baseado em autogênio Agentic.azd init -t azure/gpt-rag -b agentic
2 Ativar isolamento de rede
azd env set AZURE_NETWORK_ISOLATION true 3 Faça login no Azure:
2.Um desenvolvedor do Azure CLI:
azd auth login2.B CLI do Azure:
az login4 Comece a construir a implantação de infraestrutura e componentes:
azd provision5 Em seguida, você usará a máquina virtual com a conexão de bastião (criada durante a etapa 4) para continuar a implantação.
Faça login na VM criada com o usuário GPTrag e autentique com a senha armazenada no keyvault, semelhante à figura abaixo:

6 Ao acessar o Windows, instale o PowerShell, pois os outros pré -requisitos já estão instalados na VM.
7 Abra o prompt de comando e execute o seguinte comando para atualizar o AZD para a versão mais recente:
choco upgrade azd
Depois de atualizar o AZD, basta fechar e reabrir o terminal.
8 Crie um novo diretório, por exemplo, deploy e digite o diretório criado.
mkdir deploy
cd deploy
Para finalizar o procedimento, execute os comandos subsequentes no prompt de comando para concluir com êxito a implantação:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
NOTA: Ao executar o
azd init ...eazd env refresh, use o mesmo nome, assinatura e região do mesmo ambiente usado no provisionamento inicial da infraestrutura.
Feito! A implantação zero de confiança é concluída.
Recomendado : Adicione a autenticação do aplicativo. Assista a este tutorial rápido para orientações passo a passo.
Esta seção fornece guias rápidos para personalizar, gerenciar e solucionar problemas de sua implantação.
O processo de implantação padrão configura recursos do Azure e implanta os componentes do acelerador com uma configuração padrão. Para adaptar a implantação às suas necessidades específicas, siga as etapas na seção de implantação personalizada para obter mais opções de personalização.
Depois de implantar com sucesso a solução GPT-RAG como prova de conceito e estar pronto para formalizar a implantação usando um processo de IC/CD adequado para acelerar sua implantação na produção, consulte os guias de implantação de vários ambientes para o Azure DevOps ou o Github.
Se você encontrar algum erro durante o processo de implantação, consulte a página Solução de problemas para obter orientações sobre como resolver problemas comuns.
Para avaliar o desempenho de sua implantação, consulte o Guia de Teste de Desempenho para metodologias de teste e práticas recomendadas.
Aprenda a consultar e analisar os dados da conversa seguindo as etapas descritas no documento de como consultar e analisar as conversas.
Entenda as implicações de custo de sua implantação revisando o modelo de preços para obter uma estimativa detalhada de preços.
Garanta a governança adequada de sua implantação seguindo as diretrizes fornecidas no modelo de governança.
Agradecemos o seu interesse em contribuir para este projeto! Consulte a página Contribuindo.md para obter diretrizes detalhadas sobre como contribuir, incluindo informações sobre o Contrato de Licença de Colaborador (CLA), Código de Conduta e o processo para enviar solicitações de tração.
Obrigado pelo seu apoio e contribuições!
Este projeto pode conter marcas comerciais ou logotipos para projetos, produtos ou serviços. O uso autorizado de marcas comerciais ou logotipos da Microsoft está sujeito e deve seguir as diretrizes de marca registrada e marca da Microsoft. O uso de marcas comerciais da Microsoft ou logotipos em versões modificadas deste projeto não deve causar confusão ou implicar o patrocínio da Microsoft. Qualquer uso de marcas comerciais ou logotipos de terceiros estão sujeitas às políticas de terceiros.