OpenAI RAG for Reddit Comments QnA using Docker Download - OpenAI RAG for Reddit Comments QnA using Docker Download

OpenAI RAG for Reddit Comments QnA using Docker

Autre code source

1.0.0

Télécharger

Interface de chat reddit

Bienvenue à l'interface de chat Summarizer Reddit Post. Cette application basée sur le rationalisation permet aux utilisateurs d'extraire et de résumer le contenu à partir des URL Reddit de manière transparente et de maintenir des sessions QA. Ceci est ma première tentative d'utilisation de LLMS avec des DB vectoriels pour QA, résumé, fin de réglage fin.

Architecture

Extraction d'entrée et de contenu

L'application initie avec une interface de chat conviviale. Les utilisateurs peuvent saisir une URL Reddit dans la zone de recherche, et le système entreprend les étapes suivantes:

Validation de l'URL : l'application vérifie si l'URL entrée appartient à Reddit.
Intégration de Praw : lors de la validation réussie de l'URL, l'emballage API Python Reddit (PRAW) est utilisé pour extraire le contenu du poteau Reddit. Cela inclut l'auto-texte et les commentaires associés au message.
Données Chunking et intégration : l'auto-texte et les commentaires récupérés sont divisés en segments plus petits et digestibles (morceaux). Chaque morceau est ensuite intégré et les intégres sont stockés dans une base de données vectorielle, Pinecone. Cette étape est essentielle pour une récupération efficace des données.

Récapitulation

Après le processus d'extraction et d'incorporation, l'application génère un résumé du post Reddit à l'aide d'un modèle de langue (LLM) tel que OpenAI GPT-3.5. Le processus de résumé peut être décomposé dans les étapes suivantes:

Génération de morceaux : un morceau de texte de taille appropriée est généré en résumant récursivement des morceaux jusqu'à ce qu'il corresponde à la limite de jeton du LLM.
Interaction du modèle LLM : une invite de résumé est envoyée au modèle LLM, qui renvoie par la suite un résumé concis de la publication. Ce résumé capture l'essence du contenu Reddit.

Interface de chat et Q&R interactive

L'application fournit une interface de chat où les utilisateurs peuvent interagir avec le système et poser des questions sur la publication Reddit. L'interface de chat a des fonctionnalités distinctes:

Traitement de la question contextuelle : Lorsqu'un utilisateur pose une question, le système intègre la question et recherche la base de données vectorielle pour la similitude du contexte. Il récupère le contexte pertinent et l'ajoute à la question de l'utilisateur dans le cadre de l'invite.
Génération de réponses : Cette invite étendue est ensuite envoyée au modèle LLM, qui produit une réponse détaillée et consciente du contexte.
Modèle de réglage fin : Pour s'assurer que les réponses sont de style Reddit, le modèle LLM peut être affiné avec les paires de questions de questions Reddit, offrant des réponses qui s'alignent avec la langue communautaire de Reddit.

Sélection du modèle

L'une des fonctionnalités uniques de l'application est la possibilité pour les utilisateurs de choisir le modèle de langue qu'ils souhaitent utiliser. Cette flexibilité est facilitée par Langchain, un outil qui permet à l'application de basculer de manière transparente entre différents modèles LLM en fonction des préférences de l'utilisateur.

Commencer

Clé API OpenAI: vous aurez besoin d'une clé API OpenAI pour utiliser les modèles GPT. Ajoutez la touche au fichier .env.example.
Clé API PineCone: Ajoutez la touche API PineCone au fichier .env.example.
Obtenez des informations d'identification Reddit Praw comme indiqué dans le fichier .env.example.
Exécutez le code suivant pour commencer.

cp .env.example .env
docker build -t reddit-gpt .
docker run -d --env-file .env -p 8501:8501 reddit-gpt

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-28
taille 4.06MB
Provenant de Github

Applications connexes

docker nzbget

2024-11-15
docker mc proxy

2024-11-12
azure sdk for js

2024-11-10
docker selenium

2024-11-10
ComfyUI Docker

2024-11-06
openai realtime console

2024-11-05

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout