Descarga RAG Retrieval Augmented Generation - Código fuente RAG Retrieval Augmented Generation

RAG Retrieval Augmented Generation

Otro código fuente

1.0.0

Descargar

Rag - Recuperación de generación aumentada

Use Watsonx para responder a las preguntas del lenguaje natural utilizando el enfoque de RAG

Este cuaderno contiene los pasos y el código para demostrar el apoyo de la generación de recuperación a unión en Watsonx.ai. Presenta comandos para la recuperación de datos, la construcción y consulta de la base de conocimiento y las pruebas de modelos.

Objetivo

Use el modelo LLM, Langchain y Milvus para crear un sistema de generación aumentada de recuperación (RAG). Esto nos permitirá hacer preguntas sobre nuestros documentos (que no se incluyeron en los datos de capacitación), sin atreverse al modelo de lenguaje grande (LLM). Cuando usa RAG, si se le da una pregunta, primero hace un paso de recuperación para obtener cualquier documento relevante de una base de datos especial, una base de datos vectorial donde se indexaron estos documentos.

La generación aumentada de recuperación (RAG) es un patrón versátil que puede desbloquear una serie de casos de uso que requieren un retiro de información objetivo de información, como consultar una base de conocimiento en lenguaje natural.

Definiciones:

LLM - Modelo de lenguaje grande
Langchain: un marco diseñado para simplificar la creación de aplicaciones utilizando LLMS
Base de datos Vector: una base de datos que organiza datos a través de vectores de alta inmensidad
MILVUS - Base de datos vectorial
Rag - Generación aumentada de recuperación (ver a continuación más detalles sobre trapos)

¿Qué es un sistema de generación aumentada (trapo) de recuperación?

Gran Modelos de idiomas (LLM) ha demostrado su capacidad para comprender el contexto y proporcionar respuestas precisas a varias tareas de PNL, incluida la resumen, las preguntas y respuestas, cuando se solicitan. Si bien pueden proporcionar muy buenas respuestas a las preguntas sobre la información con la que fueron capacitados, tienden a alucinar cuando el tema trata sobre información que "no saben", es decir, no se incluyó en sus datos de capacitación. La generación aumentada de recuperación combina recursos externos con LLM. Los dos componentes principales de un trapo son, por lo tanto, un retriever y un generador.

La parte de recuperación se puede describir como un sistema que puede codificar nuestros datos para que se puedan recuperar fácilmente las partes relevantes de él al consultarlos. La codificación se realiza utilizando incrustaciones de texto, es decir, un modelo capacitado para crear una representación vectorial de la información. La mejor opción para implementar un Retriever es una base de datos vectorial. Como base de datos vectorial, existen múltiples opciones, tanto de código abierto como de productos comerciales. Pocos ejemplos son ChromadB, Mevius, Faiss, Pinecone, Weaviate. Nuestra opción en este cuaderno será una instancia local de ChromAdB (persistente).

Para la parte del generador, la opción obvia es un LLM. En este cuaderno utilizaremos un modelo cuantizado de LLAMA V2, de la colección Kaggle Models.

La orquestación del Retriever y el generador se realizará usando Langchain. Una función especializada de Langchain nos permite crear el generador receptor en una línea de código.

En su forma más simple, RAG requiere 3 pasos:

Pasajes de la base de conocimiento del índice (una vez)
Recupere el pasaje relevante de la base de conocimiento (para cada consulta de usuarios)
Genere una respuesta alimentando el pasaje recuperado en un modelo de lenguaje grande (para cada consulta de usuarios)

Datos:

Base de conocimiento:

690,000 palabras de texto limpiado de Wikipedia.

Conjuntos de datos de trenes y pruebas:

Hay tres archivos de preguntas, uno para cada año de estudiantes: S08, S09 y S10.

Los archivos "Preguntaswerpairs.txt" contienen tanto las preguntas como las respuestas. Las columnas en este archivo son las siguientes:

Articletitle es el nombre del artículo de Wikipedia del que inicialmente llegaron preguntas y respuestas.
La pregunta es la pregunta.
La respuesta es la respuesta.
Dificultad para el momento de la oferta es la calificación de dificultad prescrita para la pregunta que se le da al escritor de preguntas.
Dificultad para el mando es una calificación de dificultad asignada por el individuo que evaluó y respondió la pregunta, que puede diferir de la dificultad en el campo 4.
Artemfile es el nombre del archivo con el artículo relevante.

Las preguntas que se consideraron pobres fueron descartadas de este conjunto de datos.

Con frecuencia, hay múltiples líneas con la misma pregunta, que aparecen si esas preguntas fueron respondidas por múltiples individuos. https://www.kaggle.com/rtatman/questionanswer-dataset

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-26
tamaño 8.85MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
Retos de la Generación Cero CODEX

2022-11-02
Generación Cero – Disturbios Alpinos

2022-08-20

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo