OpenAI RAG for Reddit Comments QnA using Docker - OpenAI RAG for Reddit Comments QnA using Docker

OpenAI RAG for Reddit Comments QnA using Docker

Kode sumber lainnya

1.0.0

Unduh

Antarmuka obrolan reddit

Selamat datang di antarmuka obrolan Reddit Post Sumarizer. Aplikasi berbasis streamlit ini memungkinkan pengguna untuk mengekstrak dan merangkum konten dari URL Reddit dengan mulus dan mengadakan sesi QA. Ini adalah upaya pertama saya untuk menggunakan LLMS dengan DBS vektor untuk QA, peringkasan, tujuan penyempurnaan.

Arsitektur

Input dan ekstraksi konten

Aplikasi dimulai dengan antarmuka obrolan yang ramah pengguna. Pengguna dapat memasukkan URL Reddit ke dalam kotak pencarian, dan sistem melakukan langkah -langkah berikut:

Validasi URL : Aplikasi memverifikasi apakah URL yang dimasukkan milik Reddit.
Integrasi PRAW : Setelah validasi URL yang berhasil, Python Reddit API Wrapper (Praw) digunakan untuk mengekstrak isi pos Reddit. Ini termasuk teks diri dan komentar yang terkait dengan posting.
Data chunking dan embedding : Teks diri yang diambil dan komentar dipecah menjadi segmen yang lebih kecil dan dapat dicerna (potongan). Setiap potongan kemudian tertanam, dan embeddings disimpan dalam database vektor, pinus. Langkah ini sangat penting untuk pengambilan data yang efisien dan cepat.

Peringkasan

Setelah proses ekstraksi dan penyematan, aplikasi menghasilkan ringkasan pos Reddit menggunakan model bahasa (LLM) seperti OpenAI GPT-3.5. Proses peringkasan dapat dipecah menjadi langkah -langkah berikut:

Generasi Chunk : Sepotong teks dengan ukuran yang sesuai dihasilkan oleh ringkasan rekursif sampai sesuai dengan batas token LLM.
Interaksi Model LLM : Prompt yang diringkas dikirim ke model LLM, yang kemudian mengembalikan ringkasan ringkas dari posting. Ringkasan ini menangkap esensi konten Reddit.

Antarmuka obrolan dan tanya jawab interaktif

Aplikasi ini menyediakan antarmuka obrolan di mana pengguna dapat berinteraksi dengan sistem dan mengajukan pertanyaan tentang posting Reddit. Antarmuka obrolan memiliki beberapa fitur yang berbeda:

Pemrosesan Pertanyaan Kontekstual : Ketika seorang pengguna mengajukan pertanyaan, sistem menanamkan pertanyaan dan mencari database vektor untuk kesamaan konteks. Ini mengambil konteks yang relevan dan menambahkannya ke pertanyaan pengguna sebagai bagian dari prompt.
Generasi Jawaban : Prompt yang diperluas ini kemudian dikirim ke model LLM, yang menghasilkan jawaban yang terperinci dan sadar konteks.
Model fine-tuning : Untuk memastikan bahwa jawabannya bergaya Reddit, model LLM dapat disesuaikan dengan pasangan tanya jawab Reddit, memberikan tanggapan yang selaras dengan bahasa komunitas Reddit.

Pemilihan model

Salah satu fitur unik dari aplikasi ini adalah kemampuan bagi pengguna untuk memilih model bahasa yang ingin mereka gunakan. Fleksibilitas ini difasilitasi oleh Langchain, alat yang memungkinkan aplikasi untuk beralih dengan mulus antara model LLM yang berbeda sesuai dengan preferensi pengguna.

Memulai

Kunci API OpenAI: Anda akan memerlukan kunci API OpenAI untuk menggunakan model GPT. Tambahkan tombol ke file .env.example.
Kunci API Pinecone: Tambahkan tombol API Pinecone ke file .env.example.
Dapatkan kredensial Reddit Praw sebagaimana tercantum dalam file .env.example.
Jalankan kode berikut untuk memulai.

cp .env.example .env
docker build -t reddit-gpt .
docker run -d --env-file .env -p 8501:8501 reddit-gpt

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-05-28
ukuran 4.06MB
Berasal dari Github

Aplikasi Terkait

docker nzbget

2024-11-15
docker mc proxy

2024-11-12
azure sdk for js

2024-11-10
docker selenium

2024-11-10
ComfyUI Docker

2024-11-06
openai realtime console

2024-11-05

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua