rag with amazon opensearch and sagemaker Descargar - Descargar el código fuente de rag with amazon opensearch and sagemaker

rag with amazon opensearch and sagemaker

Otro código fuente

1.0.0

Descargar

Qa con LLM y RAG (generación de recuperación aumentada)

Este proyecto es una aplicación de respuesta a preguntas con grandes modelos de idiomas (LLM) y el servicio de Amazon OpenSearch. Una aplicación que utiliza el enfoque RAG (Recuperación de generación aumentada) recupera la información más relevante para la solicitud del usuario de la base o contenido de conocimiento empresarial, lo inclina como contexto junto con la solicitud del usuario como un mensaje, y luego la envía a la LLM para obtener una respuesta de Genai.

Los LLM tienen limitaciones en torno al recuento de palabras máximo para el mensaje de entrada, por lo tanto, elegir los pasajes correctos entre miles o millones de documentos en la empresa, tiene un impacto directo en la precisión de la LLM.

En este proyecto, el servicio Amazon OpenSearch se utiliza para la base de conocimiento.

La arquitectura general es así:

Flujo de trabajo general

Implemente las pilas CDK (para obtener más información, ver aquí).
- Un punto final de Sagemaker para la generación de texto.
- Un punto final de Sagemaker para generar embedidas.
- Un clúster de Amazon OpenSearch para almacenar incrustaciones.
- Las credenciales de acceso de OpenSearch Cluster (nombre de usuario y contraseña) almacenadas en AWS Secrets Mananger como un nombre como OpenSearchMasterUserSecret1-xxxxxxxxxxxx .
Abra Sagemaker Studio y luego abra una nueva terminal.
Ejecute los siguientes comandos en el terminal para clonar el repositorio de código para este proyecto:
```
 git clone --depth=1 https://github.com/ksmin23/rag-with-amazon-opensearch-and-sagemaker.git
```
Abra data_ingestion_to_opensearch Notebook y ejecutarlo. (Para más información, ver aquí)
Ejecute la aplicación Streamlit. (Para más información, ver aquí)

Referencias

Cree una poderosa pregunta respondiendo a Bot con Amazon Sagemaker, Amazon OpenSearch Service, Streamlit y Langchain (2023-05-25)
Use modelos de base patentados de Amazon Sagemaker JumpStart en Amazon Sagemaker Studio (2023-06-27)
Construya aplicaciones a Stiplit en Amazon Sagemaker Studio (2023-04-11)
Cree rápidamente aplicaciones de IA generativas de alta precisión en datos empresariales utilizando Amazon Kendra, Langchain y modelos de idiomas grandes (2023-05-03)
- (Github) muestras de retriver de Amazon Kendra
Respuesta de preguntas utilizando la generación de recuperación aumentada con modelos de base en Amazon Sagemaker JumpStart (2023-05-02)
Las capacidades de base de datos vectoriales del servicio de Amazon OpenSearch explican
Langchain: un marco para desarrollar aplicaciones alimentadas por modelos de idiomas.
Streamlit: una forma más rápida de construir y compartir aplicaciones de datos
Mejorar la relevancia de búsqueda con ML en Amazon OpenSearch Service Workshop - Módulo 7. Recuperación de generación aumentada
RAG-With-Amazon-Kendra-Aplicación de respuesta de preguntas con modelos de idiomas grandes (LLMS) y Amazon Kendra
RAG-With-Postgresql-PGVector-Aplicación de respuesta de preguntas con modelos de idiomas grandes (LLM) y Amazon Aurora Postgresql

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-06
tamaño 599.28KB
Proviene de Github

Aplicaciones relacionadas

amazon ssm agent

2024-11-03
atrapado con bufón

2024-02-23
Creador de juegos de rol CON

2024-02-23
Con mi pasado

2024-02-21
Texto con Jesús

2023-08-17
Subir con carretilla

2022-08-26

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo