Descarga Seedly Articles RAG - Código fuente de Seedly Articles RAG

Seedly Articles RAG

Otro código fuente

1.0.0

Descargar

Recuperación de generación aumentada con artículos de semillas

Describir

En este proyecto, construí un trapo en el LLAMA3-70B-8192 LLM, accedido con Groq API. Los documentos utilizados para RAG se recuperaron a través de WebScapping of the Segedly Blog, que contiene artículos sobre finanzas personales. Los artículos que recuperé se trataban principalmente de comprar propiedades en Singapur y pólizas de seguro. El objetivo es desarrollar un modelo de lenguaje que sea más consciente del contexto y capaz de responder preguntas relacionadas con las finanzas personales dentro del contexto de Singapur.

Método

Utilicé Scrapy para raspar los artículos, el modelo All-Minilm-L6-V2 para la conversión de fragmentos de texto en embedidas y la tienda Vector Faiss para el almacenamiento y recuperación de texto. Finalmente, utilicé Langchain para interactuar todos los diferentes componentes, desde la recuperación de fragmentos de texto hasta provocar estructuración y encadenamiento para lograr una salida deseada.

La salida final se genera encadenando dos indicaciones, el primero en resumir el contexto proporcionado (los 3 principales fragmentos de texto similar a la pregunta que el usuario hizo), y el segundo para generar una respuesta real. Esto es para garantizar que el aviso utilizado para generar respuestas no se vuelva demasiado tiempo (si contiene fragmentos de texto de longitud completa como contexto), lo que permite que se proporcione más contexto a la LLM.

El encadenamiento de indicaciones funciona como se esperaba, con resumen de fragmentos de texto agregados con éxito a la segunda solicitud. El rendimiento de la tubería varía según la calidad de los documentos de contexto proporcionados.

Guiones

WebsCrapping: artículo_spider.py
Creación de tiendas vectoriales: faiss_db.py
Implementación de trapo: SEDENLY_RAG.PY

Reflexiones

Al hacer este proyecto, aprendí cómo implementar un trapo usando Langchain, cómo interactuar un LLM con plantillas de inmediato y encadenar con aviso utilizando el lenguaje de expresión de Langchain (LCEL) y cómo usar tiendas vectoriales e incrustar funciones junto con Langchain. Creo que estos conceptos fundamentales del desarrollo de aplicaciones LLM me permitirán construir aplicaciones LLM más complejas en el futuro.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-31
tamaño 1.69MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Ycbw.Articles programa sencillo de creación de sitios web v1.0.0.0

2022-06-07
Ycbw.Articles programa sencillo de creación de sitios web

2013-08-22
Código fuente de los artículos de LCweb

2010-08-09
ArtículosSistema de artículos extremadamente rápido

2009-05-17

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo