El patrón RAG permite a las empresas utilizar las capacidades de razonamiento de LLM, utilizando sus modelos existentes para procesar y generar respuestas basadas en nuevos datos. RAG facilita las actualizaciones de datos periódicos sin la necesidad de ajustar, a agilización de la integración de LLM en empresas.
El Acelerador de solución de RAG Enterprise (GPT-RAG) ofrece una arquitectura robusta adaptada para la implementación de grado empresarial del patrón RAG. Asegura las respuestas fundamentadas y se basa en la seguridad de la confianza cero y la IA responsable, asegurando la disponibilidad, la escalabilidad y la auditabilidad. Ideal para organizaciones que pasan de exploración y etapas de POC a producción a gran escala y MVP.
Consulte nuestra Guía de usuarios y administradores para obtener detalles completos de configuración y uso.
GPT-RAG sigue un enfoque modular, que consta de tres componentes, cada uno con una función específica.
Ingestión de datos : optimiza la fragmentación de datos e indexación para el paso de recuperación de RAG.
Orchestrator : coordina el flujo para recuperar información y generar una respuesta del usuario. Ofrece dos opciones: funcional , utilizando funciones de núcleo semántico (predeterminado) y agente , utilizando agentes autógenos. Consulte las instrucciones de implementación para cambiar a Agentic.
APP front-end : utiliza el patrón de backend for front-end para proporcionar una interfaz web escalable y eficiente.
Si desea obtener más información sobre el patrón de trapo y la arquitectura GPT-Rag.
Patrón de trapo: ¿Qué y por qué?
Descripción general de la arquitectura de soluciones
Aprenda a configurar rápidamente la arquitectura básica para escenarios sin aislamiento de red. Haga clic en el enlace para proceder.
Implemente el acelerador de solución utilizando la arquitectura de ajuste cero estándar con configuraciones de solución preconfiguradas. No se necesita personalización. Haga clic en el enlace para proceder.
Explore las opciones para personalizar la implementación del acelerador de solución con una arquitectura de confianza cero, ajustando la configuración de la solución a sus necesidades. Haga clic en el enlace para proceder.
Para aquellos que prefieren el control completo, siga esta guía detallada para configurar manualmente el acelerador de solución con una arquitectura de confianza cero. Haga clic en el enlace para proceder.
Esta guía lo guiará a través del proceso de implementación de Enterprise Rag. Hay dos opciones de implementación disponibles, arquitectura básica y arquitectura Zero Trust . Antes de comenzar la implementación, asegúrese de haber preparado todas las herramientas y servicios necesarios como se describe en la sección de requisitos previos .
Requisitos previos
** Si no ha creado un recurso de servicio Azure AI en la suscripción antes
Para demostraciones rápidas o proyectos de prueba de concepto sin requisitos de aislamiento de red, puede implementar el acelerador utilizando su arquitectura básica. 
El procedimiento de implementación es bastante simple, solo instale los requisitos previos mencionados anteriormente y siga estos cuatro pasos utilizando el desarrollador de Azure CLI (AZD) en un terminal:
1 Descargar el repositorio:
azd init -t azure/gpt-ragNota : Agregue
-b agenticsi usa el orquestador basado en autógenos de agente.azd init -t azure/gpt-rag -b agentic
2 Iniciar sesión en Azure:
2. Un desarrollador de Azure CLI:
azd auth login2.B Azure CLI:
az login3 Comience a construir la implementación de infraestructura y componentes:
azd up4 Agregar documentos fuente al almacenamiento de objetos
Cargue sus documentos a la carpeta 'Documentos' ubicada en la cuenta de almacenamiento. El nombre de esta cuenta debe comenzar con 'Strag'. Esta es la cuenta de almacenamiento predeterminada, como se muestra en la imagen de muestra a continuación.

¡Hecho! Se completa la implementación básica.
Recomendado : Agregar autenticación de aplicaciones. Mire este tutorial rápido para la guía paso a paso.
Para implementaciones más seguras y aisladas, puede optar por la arquitectura Zero Trust. Esta arquitectura es ideal para entornos de producción donde el aislamiento de la red y las estrictas medidas de seguridad son altamente valoradas.

Antes de implementar la arquitectura Zero Trust, asegúrese de revisar los requisitos previos. Es importante tener en cuenta que solo necesitará Node.js y Python para la segunda parte del proceso, que se llevará a cabo en la VM creada durante la implementación de esta arquitectura.
El procedimiento de implementación es similar al de la arquitectura básica, pero con algunos pasos adicionales. Para obtener una guía detallada sobre la implementación de esta opción, consulte las instrucciones a continuación:
1 Descargar el repositorio
azd init -t azure/gpt-ragNota : Agregue
-b agenticsi usa el orquestador basado en autógenos de agente.azd init -t azure/gpt-rag -b agentic
2 Habilitar el aislamiento de la red
azd env set AZURE_NETWORK_ISOLATION true 3 Iniciar sesión en Azure:
2. Un desarrollador de Azure CLI:
azd auth login2.B Azure CLI:
az login4 Comience a construir la implementación de infraestructura y componentes:
azd provision5 A continuación, usará la máquina virtual con la conexión Bastion (creada durante el paso 4) para continuar la implementación.
Inicie sesión en la VM creada con el usuario GPTRAG y se autentica con la contraseña almacenada en el keyVault, similar a la figura a continuación:

6 Al acceder a Windows, instale PowerShell, ya que los otros requisitos previos ya están instalados en la VM.
7 Abra el símbolo del sistema y ejecute el siguiente comando para actualizar AZD a la última versión:
choco upgrade azd
Después de actualizar AZD, simplemente cierre y vuelva a abrir el terminal.
8 Cree un nuevo directorio, por ejemplo, deploy luego ingrese el directorio creado.
mkdir deploy
cd deploy
Para finalizar el procedimiento, ejecute los comandos posteriores en el símbolo del sistema para completar con éxito la implementación:
azd init -t azure/gpt-rag
azd auth login
azd env refresh
azd package
azd deploy
Nota: Al ejecutar el
azd init ...yazd env refresh, use el mismo nombre del entorno, suscripción y región utilizada en el aprovisionamiento inicial de la infraestructura.
¡Hecho! Se completa el despliegue de confianza.
Recomendado : Agregar autenticación de aplicaciones. Mire este tutorial rápido para la guía paso a paso.
Esta sección proporciona guías rápidas para personalizar, administrar y solucionar problemas de su implementación.
El proceso de implementación estándar establece recursos de Azure e implementa los componentes del acelerador con una configuración estándar. Para adaptar la implementación a sus necesidades específicas, siga los pasos en la sección de implementación personalizada para obtener más opciones de personalización.
Una vez que haya implementado con éxito la solución GPT-RAG como una prueba de concepto y esté listo para formalizar la implementación utilizando un proceso de CI/CD adecuado para acelerar su implementación en la producción, consulte las guías de implementación multi-ambiente para Azure DevOps o GitHub.
Si encuentra algún error durante el proceso de implementación, consulte la página de solución de problemas para obtener orientación sobre la resolución de problemas comunes.
Para evaluar el rendimiento de su implementación, consulte la Guía de pruebas de rendimiento para las metodologías de prueba y las mejores prácticas.
Aprenda cómo consultar y analizar los datos de conversación siguiendo los pasos descritos en el documento de cómo consultar y analizar las conversaciones.
Comprenda las implicaciones de costos de su implementación revisando el modelo de precios para una estimación de precios detallada.
Asegure el gobierno adecuado de su despliegue siguiendo las pautas proporcionadas en el modelo de gobierno.
¡Agradecemos su interés en contribuir a este proyecto! Consulte la página Contributing.MD para obtener pautas detalladas sobre cómo contribuir, incluida la información sobre el Acuerdo de Licencia de Contributor (CLA), el Código de Conducta y el proceso para enviar solicitudes de extracción.
¡Gracias por su apoyo y contribuciones!
Este proyecto puede contener marcas comerciales o logotipos para proyectos, productos o servicios. El uso autorizado de marcas o logotipos de Microsoft está sujeto y debe seguir las pautas de marca y marca de Microsoft. El uso de marcas registradas de Microsoft o logotipos en versiones modificadas de este proyecto no debe causar confusión o implicar el patrocinio de Microsoft. Cualquier uso de marcas comerciales o logotipos de terceros está sujeto a las políticas de esas partes de terceros.