chatbot ด้วย PDF สำหรับการค้นหาความหมายผ่านเอกสาร (สร้างด้วย Streamlit, Langchain, Pinecone/Chroma/Azure Search Search)
ที่เก็บนี้มีตัวอย่างรหัสสำหรับวิธีการสร้าง chatbot แบบโต้ตอบสำหรับการค้นหาความหมายผ่านเอกสาร chatbot ช่วยให้ผู้ใช้ถามคำถามภาษาธรรมชาติและรับคำตอบที่เกี่ยวข้องจากชุดเอกสาร chatbot ใช้ streamlit สำหรับอินเตอร์เฟสเว็บและ chatbot, langchain และใช้ประโยชน์จากฐานข้อมูลเวกเตอร์ประเภทต่าง ๆ เช่น pinecone, chroma และการค้นหาเวกเตอร์ของ Azure Cognitive Search เพื่อทำการค้นหาที่คล้ายคลึงกันอย่างมีประสิทธิภาพและแม่นยำ รหัสถูกเขียนใน Python และสามารถแก้ไขได้อย่างง่ายดายเพื่อให้เหมาะกับกรณีการใช้งานที่แตกต่างกันและแหล่งข้อมูล
โปรดตรวจสอบเรื่องราวของฉันในสื่อกลาง (ฐานข้อมูล Streamlit และ Vector: คู่มือการสร้างแอพพลิเคชั่นเว็บแบบอินเทอร์แอคทีฟสำหรับการค้นหาความหมายผ่านเอกสาร) สำหรับการแบ่งปันรายละเอียดเพิ่มเติม
- preprocess_pinecone.ipynb <- ตัวอย่างของการใช้แบบจำลองการฝังจากบริการ Azure openai เพื่อฝังเนื้อหาจากเอกสารและบันทึกลงในฐานข้อมูลเวกเตอร์ Pinecone
- preprocess_chroma.ipynb <- ตัวอย่างของการใช้แบบจำลองการฝังตัวจากบริการ Azure Openai เพื่อฝังเนื้อหาจากเอกสารและบันทึกลงในฐานข้อมูล chroma Vector
- preprocess_acs.ipynb <- ตัวอย่างของการใช้แบบจำลองการฝังจากบริการ Azure openai เพื่อฝังเนื้อหาจากเอกสารและบันทึกลงในฐานข้อมูลเวกเตอร์การค้นหาความรู้ความเข้าใจ Azure
- consume_pinecone.ipynb <-ตัวอย่างของการใช้โมดูลการตอบคำถาม Langchain เพื่อทำการค้นหาที่คล้ายคลึงกันจากฐานข้อมูลเวกเตอร์ Pinecone และใช้ GPT-3.5 (Text-Davinci-003) เพื่อสรุปผลลัพธ์
- consume_chroma.ipynb <-ตัวอย่างของการใช้โมดูลการตอบคำถามของ Langchain เพื่อทำการค้นหาที่คล้ายคลึงกันจากฐานข้อมูล chroma Vector และใช้ GPT-3.5 (Text-Davinci-003) เพื่อสรุปผลลัพธ์
- Consume_acs.ipynb <-ตัวอย่างของการใช้โมดูลการตอบคำถามของ Langchain เพื่อทำการค้นหาที่คล้ายคลึงกันจากฐานข้อมูลเวกเตอร์การค้นหา Azure Cognitive และใช้ GPT-3.5 (Text-Davinci-003) เพื่อสรุปผลลัพธ์
- app_pinecone.py <- ตัวอย่างของการใช้ฐานข้อมูล streamlit, langchain และ pinecone เวกเตอร์เพื่อสร้าง chatbot แบบโต้ตอบเพื่ออำนวยความสะดวกในการค้นหาความหมายผ่านเอกสาร มันใช้รุ่น GPT-3.5-turbo จากบริการ Azure OpenAI สำหรับการสรุปผลลัพธ์และการแชท
- app_chroma.py <- ตัวอย่างของการใช้ฐานข้อมูล Streamlit, Langchain และ Chroma Vector เพื่อสร้าง chatbot แบบโต้ตอบเพื่ออำนวยความสะดวกในการค้นหาความหมายผ่านเอกสาร มันใช้รุ่น GPT-3.5-turbo จากบริการ Azure OpenAI สำหรับการสรุปผลลัพธ์และการแชท
- app_acs.py <- ตัวอย่างของการใช้ Streamlit, Langchain และ Azure Cognitive Search Vector ฐานข้อมูลเพื่อสร้าง chatbot แบบโต้ตอบเพื่ออำนวยความสะดวกในการค้นหาความหมายผ่านเอกสาร มันใช้รุ่น GPT-3.5-turbo จากบริการ Azure OpenAI สำหรับการสรุปผลลัพธ์และการแชท
เพื่อเรียกใช้แอปพลิเคชันเว็บสตรีมแสงนี้
streamlit run app_pinecone.py
สถาปัตยกรรมระดับสูงและการไหลของการค้นหาความหมายนี้ผ่านการสาธิตเอกสาร 
สนุก!