Rag untuk makalah dengan kode adalah metode yang lebih mudah untuk memindai banyak penelitian ML dengan hanya menekan tombol. Sistem RAG yang menambah sejumlah besar informasi dengan mudah. Anda akan menanyakan pertanyaan Anda dalam bahasa alami dan itu akan menjawab sesuai dengan makalah yang relevan yang ditemukannya pada kertas dengan kode.
Di sisi backend, sistem ini ditenagai dengan kerangka pengambilan augmented generasi (RAG) yang bergantung pada database vektor tanpa server yang dapat diskalakan yang disebut Upstash, untuk embeddings kami menggunakan model BGE pada permukaan pelukan, dan mixtral-8x7b-instruct-v0.1 sebagai llm dari huggingface.
Di sisi front-end, asisten ini akan diintegrasikan ke dalam aplikasi web yang interaktif dan mudah digunakan yang dibangun dengan streamlit.
Kloning repo
git clone https://github.com/wittyicon29/PWC-RAG.gitPindah ke direktori ruang kerja
cd PWC-RAG Pengindeksan ke indeks data ke vektor DB, pertama -tama Anda harus membuat indeks pada Upstash dan mengisi kredensial dalam file .env :
UPSTASH_URL=...
UPSTASH_TOKEN=...
Jalankan perintah berikut:
python -m src.index_papers --query " Mistral " --limit 200Hasil pengindeksan 200 potongan yang cocok dengan kueri "Mistral".


Menjalankan Aplikasi StreamLit secara lokal
Sebelum menjalankan aplikasi StreamLit, Anda harus mengatur token API HuggingFace di file '.env':
HUGGINGFACE_API_TOKEN=...Sekarang Anda dapat aplikasi streamlit
python -m streamlit run src/app.py
Cara membangun aplikasi bertenaga LLM untuk mengobrol dengan kertas dengan kode