แอพที่ใช้ streamlit เพื่อนำเสนออินเทอร์เฟซที่ใช้งานง่ายสำหรับการสร้างท่อส่ง RAG แอพอนุญาตให้ผู้ใช้อัปโหลด PDF fies ของเขา/เธอซึ่งจะถูกประมวลผลและเก็บไว้ในฐานข้อมูลเวกเตอร์ใหม่ (หรือที่มีอยู่)
จากนั้นผู้ใช้สามารถสอบถามฐานข้อมูลและรับการตอบกลับที่เกี่ยวข้องมากที่สุดที่สร้างขึ้นจากรุ่น LLM LLM ที่เราเลือกใช้คือรุ่น Gemma: 2B และสำหรับรุ่นที่ให้บริการเราใช้ Ollama
แอพยังมีความสามารถในการลบฐานข้อมูลที่มีอยู่แม้ว่าในปัจจุบันฟังก์ชั่นนี้จะถูก จำกัด สำหรับ Windows
เพื่อให้แอปทำงานก่อนอื่นคุณต้องโคลนที่เก็บนี้ สามารถทำได้ด้วยคำสั่ง:
git clone https://github.com/Jimlibo/custom-rag-app.gitหลังจากที่คุณโคลนที่เก็บแล้วคุณสามารถนำทางไปยังไดเรกทอรีของแอป:
cd custom-rag-appหากคุณติดตั้ง Docker และ Docker-compose คุณสามารถเรียกใช้แอพด้วยคำสั่งต่อไปนี้:
docker-compose upหากคุณไม่ได้ติดตั้ง Docker คุณสามารถติดตั้งแพ็คเกจที่ต้องการได้ก่อนจาก required.txt แล้วเรียกใช้แอพผ่าน Streamlit สามารถทำได้ด้วยคำสั่งต่อไปนี้:
cd src
pip install -r requirements.txt
streamlit run app.pyเพื่อที่จะเรียกใช้การอนุมานบน LLM คุณจะต้องให้บริการ Ollama เปิดใช้งาน หากเป็นครั้งแรกที่คุณเรียกใช้แอพคุณต้องดึงรุ่น Gemma: 2B จากที่เก็บ Ollama ก่อนเสิร์ฟ หากต้องการดึงโมเดลเปิดเทอร์มินัลอื่นและดำเนินการคำสั่ง:
ollama pull gemma:2bเพื่อให้บริการแบบจำลอง Run:
ollama serveแจกจ่ายภายใต้ใบอนุญาต MIT ดูใบอนุญาตสำหรับข้อมูลเพิ่มเติม