(นี่คือ POC) ตัวแทนที่มีมนุษย์ในลูปที่สามารถค้นหาเว็บสำหรับข้อมูลในขณะที่ข้ามการตรวจจับบอทสำหรับไซต์ส่วนตัว
ในการเริ่มต้นกับ repo คุณจะต้องตั้งค่าตัวแปรสภาพแวดล้อมที่จำเป็น โดยเฉพาะอย่างยิ่งคุณจะต้องสร้างและตั้งค่าตัวแปรสภาพแวดล้อมต่อไปนี้:
GPT-3.5 ของ OpenAI ใช้โดยค่าเริ่มต้น แต่คุณสามารถใช้การสนับสนุนรุ่นอื่น ๆ Langchain
* Zenrows: https://zenrows.com
นอกจากนี้คุณจะต้องตรวจสอบให้แน่ใจว่ามีการติดตั้งการพึ่งพา:
python3 -m pip install requirements.txt
เมื่อคุณตั้งค่าตัวแปรสภาพแวดล้อมที่จำเป็นและติดตั้งแพ็คเกจ Langchain แล้วคุณสามารถเริ่มใช้ chatbot ได้ เพียงเรียกใช้ไฟล์ main.py:
python3 main.py
chatbot จะแจ้งให้คุณปฏิบัติตามข้อกำหนดบางประการเพื่อให้บรรลุเป้าหมาย หากเป้าหมายไม่ชัดเจนหรือไม่ได้ให้ chatbot จะแจ้งให้คุณถาม "มนุษย์" (คุณ) โดยใช้เครื่องมือ "มนุษย์" ซึ่งรวมอยู่ในค่าเริ่มต้น หากเป้าหมายยังไม่ชัดเจนหรือไม่มีรายละเอียดเพียงพอ chatbot จะแจ้งให้คุณขอให้ "มนุษย์" ให้ข้อมูลเพิ่มเติม
chatbot ยังมีเครื่องมือที่กำหนดเองที่เรียกว่า Ninjasearch ซึ่งออกแบบมาเพื่อข้ามการตรวจจับบอทสำหรับเว็บไซต์ส่วนตัว เครื่องมือจะขูด URL ที่ระบุและส่งคืนสรุปเนื้อหาของหน้า
เครื่องมือสรุปการตอบสนองจาก URL ในขั้นตอนต่อไปนี้:
RecursiveCharacterTextSplitterRetrievalQA ) จาก LLM และ DB เพื่อให้เราสามารถถามคำถามจากเนื้อหาของหน้า หากคุณต้องการมีส่วนร่วมในโครงการนี้โปรดส่งคำขอดึงไปที่ GitHub