Download RAG Retrieval Augmented Generation - RAG Retrieval Augmented Generation CÓDIGO DOWNLOAD

RAG Retrieval Augmented Generation

Outro código-fonte

1.0.0

Baixar

Rag - geração aumentada de recuperação

Use o Watsonx para responder às perguntas da linguagem natural usando a abordagem de trava

Este notebook contém as etapas e o código para demonstrar o suporte à geração de recuperação de recuperação em watsonx.ai. Ele apresenta comandos para recuperação de dados, construção e consulta de base de conhecimento e teste de modelo.

Objetivo

Use o modelo LLM, Langchain e Milvus para criar um sistema de geração aumentada (RAG) de recuperação. Isso nos permitirá fazer perguntas sobre nossos documentos (que não foram incluídos nos dados de treinamento), sem ajustar o modelo de idioma grande (LLM). Ao usar o RAG, se você tiver uma pergunta, primeiro fará uma etapa de recuperação para buscar quaisquer documentos relevantes de um banco de dados especial, um banco de dados vetorial onde esses documentos foram indexados.

A geração aumentada de recuperação (RAG) é um padrão versátil que pode desbloquear vários casos de uso que requerem recordação factual de informações, como consultar uma base de conhecimento em linguagem natural.

Definições:

LLM - Modelo de linguagem grande
Langchain - Uma estrutura projetada para simplificar a criação de aplicativos usando LLMS
Banco de dados vetorial - um banco de dados que organiza dados através de vetores de alta dimensão
Milvus - banco de dados vetorial
RAG - Geração aumentada de recuperação (veja abaixo mais detalhes sobre trapos)

O que é um sistema de geração aumentada de recuperação (RAG)?

Os grandes modelos de linguagem (LLMS) provaram sua capacidade de entender o contexto e fornecer respostas precisas para várias tarefas de PNL, incluindo resumo, perguntas e respostas, quando solicitado. Embora possam fornecer respostas muito boas a perguntas sobre as informações que foram treinadas, elas tendem a alucinar quando o tópico é sobre informações que "não sabem", o IE não foi incluído em seus dados de treinamento. A geração aumentada de recuperação combina recursos externos com o LLMS. Os dois principais componentes de um pano são, portanto, um retriever e um gerador.

A parte do retriever pode ser descrita como um sistema capaz de codificar nossos dados para que possam ser facilmente recuperados as partes relevantes dele ao consultar. A codificação é feita usando incorporações de texto, ou seja, um modelo treinado para criar uma representação vetorial das informações. A melhor opção para implementar um retriever é um banco de dados vetorial. Como banco de dados vetorial, existem várias opções, tanto de código aberto quanto de produtos comerciais. Poucos exemplos são Chromadb, Mevius, Faiss, Pinecone, tevadores. Nossa opção neste notebook será uma instância local do Chromadb (persistente).

Para a parte do gerador, a opção óbvia é um LLM. Neste caderno, usaremos um modelo quantizado de llama v2, da coleção de modelos Kaggle.

A orquestração do retriever e do gerador será feita usando Langchain. Uma função especializada da Langchain nos permite criar o receptor-gerador em uma linha de código.

Na sua forma mais simples, o RAG requer 3 etapas:

ÍNDICE PASSAGAS BASE DE CONHECIMENTO (uma vez)
Recuperar a (s) passagem (s) relevante (s) da base de conhecimento (para cada consulta de usuário)
Gere uma resposta ao Feeding Retired Passage para um modelo de linguagem grande (para cada consulta de usuário)

Dados:

Base de conhecimento:

690.000 palavras em texto limpo da Wikipedia.

Treine e testam conjuntos de dados:

Existem três arquivos de perguntas, um para cada ano de estudantes: S08, S09 e S10.

Os arquivos "questionAnswerpairs.txt" contêm as perguntas e as respostas. As colunas neste arquivo são as seguintes:

ArticleTitle é o nome do artigo da Wikipedia, a partir do qual as perguntas e respostas vieram inicialmente.
Pergunta é a questão.
Resposta é a resposta.
Dificuldade do quequestoner é a classificação de dificuldade prescrita para a pergunta dada ao escritor de perguntas.
A dificuldades do REDERER é uma classificação de dificuldade atribuída pelo indivíduo que avaliou e respondeu à pergunta, que pode diferir da dificuldade no campo 4.
O Artigofile é o nome do arquivo com o artigo relevante.

As perguntas que foram consideradas pobres foram descartadas desse conjunto de dados.

Freqüentemente existem várias linhas com a mesma pergunta, que aparecem se essas perguntas foram respondidas por vários indivíduos. https://www.kaggle.com/rtatman/questionanswer-dataset

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-05-26
tamanho 8.85MB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
Desafios da Geração Zero CODEX

2022-11-02
Geração Zero – agitação alpina

2022-08-20

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos