Este repositório contém um guia estruturado para implementar a geração de recuperação de recuperação (RAG). Cada caderno deste repositório é projetado para ensinar um aspecto específico do RAG, a partir dos fundamentos para a construção de um pipeline de ponta a ponta.
Este guia é inspirado e baseado no trabalho de Thataiguy. O crédito total é destinado ao autor original por seus inestimáveis recursos e insights.
1_fundamentals_of_rag.ipynb
Introduz o básico da geração de recuperação de recuperação.
2_langchain_retrieval_pipeline.ipynb
Abrange como configurar um pipeline de recuperação usando Langchain para fluxos de trabalho simplificados.
3_overview_of_document_loaders.ipynb
Fornece uma visão geral dos carregadores de documentos e seu papel no processamento de dados para tarefas de recuperação.
4_document_loaders.ipynb
Um mergulho mais profundo no uso de vários carregadores de documentos com exemplos práticos.
5_text_splitter_transformation.ipynb
Explica a divisão e transformações de texto para otimizar dados para incorporar e recuperar.
6_text_embedding_models.ipynb
Concentra -se nos modelos de incorporação de texto e em suas configurações para gerar representações vetoriais significativas.
7_vector_stores_and_retrievers.ipynb
Discute as lojas de vetores e os retrievers, mostrando como armazenar e recuperar informações com eficiência.
8_retrievers.ipynb
Exploração detalhada dos tipos de retriever e sua integração com lojas vetoriais.
9_End_to_End_RAG_Chain.ipynb
Combina todos os conceitos em um pipeline de geração de recuperação de ponta a ponta.
pip install -r requirements.txt1_fundamentals_of_rag.ipynb . requirements.txt As contribuições são bem -vindas! Sinta -se à vontade para gastar este repositório e enviar uma solicitação de tração.