ดาวน์โหลด rag demystified - rag demystified Source Source Download

rag demystified

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

demystifying ท่อผ้าขี้ริ้วขั้นสูง

การดึงข้อมูลการรับเงิน (RAG) ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ (LLMS) กำลังได้รับความนิยมสำหรับการสร้างระบบตอบคำถามแบบ end-to-end เฟรมเวิร์กเช่น Llamainedex และ Haystack มีความคืบหน้าอย่างมากในการทำให้ท่อส่งเศษผ้าใช้งานง่าย ในขณะที่เฟรมเวิร์กเหล่านี้ให้นามธรรมที่ยอดเยี่ยมสำหรับการสร้างท่อส่งเศษผ้าขั้นสูงพวกเขาทำเช่นนั้นในราคาที่โปร่งใส จากมุมมองของผู้ใช้มันไม่ชัดเจนว่าเกิดอะไรขึ้นภายใต้ประทุนโดยเฉพาะอย่างยิ่งเมื่อเกิดข้อผิดพลาดหรือความไม่สอดคล้องกัน

ในแอพพลิเคชั่น EVADB นี้เราจะแสดงให้เห็นถึงการทำงานด้านในของท่อผ้าขี้ริ้วขั้นสูงโดยการตรวจสอบกลไกข้อ จำกัด และค่าใช้จ่ายที่มักจะยังคงทึบแสง

Llama ทำงานบนแล็ปท็อปเพื่อดึงข้อมูล
ลามาทำงานบนแล็ปท็อป ?

เริ่มต้นอย่างรวดเร็ว

หากคุณต้องการกระโดดเข้ามาให้ใช้คำสั่งต่อไปนี้เพื่อเรียกใช้แอปพลิเคชัน:

 pip install -r requirements.txt

echo OPENAI_API_KEY='yourkey' > .env
python complex_qa.py

ภาพรวมผ้าขี้ริ้ว

Retrieval-Augmented Generation (RAG) เป็นกระบวนทัศน์ AI ที่ทันสมัยสำหรับการตอบคำถามที่ใช้ LLM โดยทั่วไปแล้วไปป์ไลน์ผ้าขี้ริ้ว:

Data Warehouse - การรวบรวมแหล่งข้อมูล (เช่นเอกสาร, ตาราง ฯลฯ ) ที่มีข้อมูลที่เกี่ยวข้องกับงานตอบคำถาม
การดึงเวกเตอร์ - ให้คำถามค้นหาข้อมูลที่คล้ายกันมากที่สุด k ที่คล้ายกันมากที่สุดกับคำถาม สิ่งนี้ทำได้โดยใช้ร้านค้าเวกเตอร์ (เช่น FAISS)
การสร้างการตอบสนอง - ให้ข้อมูลที่คล้ายกันมากที่สุด K สร้างการตอบสนองโดยใช้แบบจำลองภาษาขนาดใหญ่ (เช่น GPT -4)

RAG ให้ข้อได้เปรียบที่สำคัญสองประการในการตอบคำถามแบบดั้งเดิมตามแบบดั้งเดิม:

ข้อมูลล่าสุด -คลังข้อมูลสามารถอัปเดตแบบเรียลไทม์ดังนั้นข้อมูลจึงทันสมัยอยู่เสมอ
การติดตามแหล่งที่มา - RAG ให้การตรวจสอบย้อนกลับที่ชัดเจนทำให้ผู้ใช้สามารถระบุแหล่งที่มาของข้อมูลซึ่งเป็นสิ่งสำคัญสำหรับการตรวจสอบความถูกต้องและบรรเทาผลกระทบ LLM

การสร้างท่อส่งผ้าขี้ริ้วขั้นสูง

เพื่อเปิดใช้งานการตอบคำถามที่ซับซ้อนมากขึ้นเฟรมเวิร์ก AI ล่าสุดเช่น Llamaidex ได้แนะนำ abstractions ขั้นสูงเช่นเอ็นจิ้นแบบสอบถามคำถามย่อย

ในแอปพลิเคชันนี้เราจะ demystify ท่อผ้าขี้ริ้วที่ซับซ้อนโดยใช้เอ็นจิ้นแบบสอบถามแบบสอบถามย่อยเป็นตัวอย่าง เราจะตรวจสอบการทำงานภายในของเอ็นจิ้นแบบสอบถามแบบสอบถามย่อยและทำให้นามธรรมของส่วนประกอบหลักของพวกเขาง่ายขึ้น นอกจากนี้เราจะระบุความท้าทายบางอย่างที่เกี่ยวข้องกับท่อส่งผ้าขี้ริ้วขั้นสูง

การตั้งค่า

คลังข้อมูลคือการรวบรวมแหล่งข้อมูล (เช่นเอกสาร, ตาราง ฯลฯ ) ที่มีข้อมูลที่เกี่ยวข้องกับงานตอบคำถาม

ในตัวอย่างนี้เราจะใช้คลังข้อมูลอย่างง่ายที่มีบทความ Wikipedia หลายบทความสำหรับเมืองยอดนิยมที่แตกต่างกันซึ่งได้รับแรงบันดาลใจจากกรณีการใช้งานของ Llamaindex วิกิของแต่ละเมืองเป็นแหล่งข้อมูลแยกต่างหาก โปรดทราบว่าเพื่อความเรียบง่ายเรา จำกัด ขนาดของแต่ละเอกสารให้พอดีภายในขีด จำกัด บริบท LLM

เป้าหมายของเราคือการสร้างระบบที่สามารถตอบคำถามเช่น:

"ประชากรของชิคาโกคืออะไร"
"ขอสรุปแง่บวกของแอตแลนต้า"
"เมืองใดมีประชากรสูงสุด"

อย่างที่คุณเห็นคำถามอาจเป็นคำถามที่เรียบง่าย/การสรุปเกี่ยวกับแหล่งข้อมูลเดียว (Q1/Q2) หรือคำถามที่ซับซ้อน/การสรุปที่ซับซ้อนผ่านแหล่งข้อมูลหลายแหล่ง (Q3)

เรามี วิธีการดึงข้อมูล ต่อไปนี้ในการกำจัดของเรา:

การดึงเวกเตอร์ - ให้คำถามและแหล่งข้อมูลสร้างการตอบสนอง LLM โดยใช้ชิ้นข้อมูลที่คล้ายกันมากที่สุดกับคำถามจากแหล่งข้อมูลเป็นบริบท เราใช้ดัชนีเวกเตอร์ FAISS แบบปิดชั้นวางจาก EVADB สำหรับการดึงเวกเตอร์ อย่างไรก็ตามแนวคิดนี้ใช้กับดัชนีเวกเตอร์ใด ๆ
สรุปการดึง - ให้คำถามสรุปและแหล่งข้อมูลสร้างการตอบสนอง LLM โดยใช้แหล่งข้อมูลทั้งหมดเป็นบริบท

ซอสลับ

ข้อมูลเชิงลึกที่สำคัญของเราคือแต่ละองค์ประกอบในไปป์ไลน์ RAG ขั้นสูงนั้นใช้พลังงานจากการโทร LLM เดียว ไปป์ไลน์ทั้งหมดเป็นชุดของการโทร LLM ที่มีเทมเพลตพรอมต์ที่สร้างขึ้นอย่างระมัดระวัง เทมเพลตที่รวดเร็วเหล่านี้คือซอสลับที่เปิดใช้งานท่อส่งเศษผ้าขั้นสูงเพื่อทำงานที่ซับซ้อน

ในความเป็นจริงไปป์ไลน์ RAG ขั้นสูงใด ๆ สามารถแบ่งออกเป็นชุดของการโทร LLM แต่ละรายการที่เป็นไปตามรูปแบบการป้อนข้อมูลสากล:

สมการ

ที่ไหน:

เทมเพลตพรอมต์ - เทมเพลตพรอมต์ที่ดูแลสำหรับงานเฉพาะ (เช่นการสร้างคำถามย่อยการสรุป)
บริบท - บริบทที่จะใช้ในการทำงาน (เช่นชิ้นข้อมูลที่คล้ายกันมากที่สุด)
คำถาม - คำถามที่จะตอบ

ตอนนี้เราแสดงให้เห็นถึงหลักการนี้โดยการตรวจสอบการทำงานภายในของเอ็นจิ้นแบบสอบถามคำถามย่อย

เอ็นจิ้นแบบสอบถามคำถามย่อยต้องทำงานสามอย่าง:

การสร้างคำถามย่อย -ให้คำถามที่ซับซ้อนแบ่งออกเป็นชุดของคำถามย่อยในขณะที่ระบุแหล่งข้อมูลที่เหมาะสมและฟังก์ชั่นการดึงข้อมูลสำหรับแต่ละคำถามย่อย
การดึงเวกเตอร์/สรุป - สำหรับแต่ละคำถามย่อยให้ใช้ฟังก์ชั่นการดึงข้อมูลที่เลือกผ่านแหล่งข้อมูลที่เกี่ยวข้องเพื่อดึงข้อมูลที่เกี่ยวข้อง
การรวมการตอบสนอง - รวมการตอบสนองจากคำถามย่อยเป็นคำตอบสุดท้าย

ลองตรวจสอบแต่ละงานโดยละเอียด

ภารกิจที่ 1: การสร้างคำถามย่อย

เป้าหมายของเราคือการแยกคำถามที่ซับซ้อนออกเป็นชุดของคำถามย่อยในขณะที่ระบุแหล่งข้อมูลที่เหมาะสมและฟังก์ชั่นการดึงข้อมูลสำหรับแต่ละคำถามย่อย ตัวอย่างเช่นคำถาม "เมืองใดมีประชากรสูงสุด" แบ่งออกเป็นห้าคำถามย่อยหนึ่งครั้งสำหรับแต่ละเมืองของรูปแบบ "ประชากร {city} คืออะไร?" แหล่งข้อมูลสำหรับแต่ละคำถามย่อยจะต้องเป็นวิกิของเมืองที่สอดคล้องกันและฟังก์ชั่นการดึงข้อมูลจะต้องเป็นการดึงเวกเตอร์

เมื่อมองแวบแรกดูเหมือนว่าจะเป็นงานที่น่ากลัว โดยเฉพาะเราต้องตอบคำถามต่อไปนี้:

เราจะรู้ได้อย่างไรว่าคำถามย่อยใดที่จะสร้าง?
เราจะรู้ได้อย่างไรว่าแหล่งข้อมูลใดที่จะใช้สำหรับแต่ละคำถามย่อย
เราจะรู้ได้อย่างไรว่าฟังก์ชั่นการดึงข้อมูลใดที่จะใช้สำหรับแต่ละคำถามย่อย

คำตอบสำหรับคำถามทั้งสามคำถามนั้นเหมือนกัน - การโทร LLM ครั้งเดียว! เอ็นจิ้นสืบค้นคำถามย่อยทั้งหมดใช้พลังงานจากการโทร LLM เดียวพร้อมเทมเพลตพรอมต์ที่สร้างขึ้นอย่างระมัดระวัง เรียกเทมเพลตนี้ว่า เทมเพลตพรอมต์คำถามย่อย

 -- Sub-question Prompt Template --

"""
    You are an AI assistant that specializes in breaking down complex questions into simpler, manageable sub-questions.
    When presented with a complex user question, your role is to generate a list of sub-questions that, when answered, will comprehensively address the original question.
    You have at your disposal a pre-defined set of functions and data sources to utilize in answering each sub-question.
    If a user question is straightforward, your task is to return the original question, identifying the appropriate function and data source to use for its solution.
    Please remember that you are limited to the provided functions and data sources, and that each sub-question should be a full question that can be answered using a single function and a single data source.
"""

บริบทสำหรับการเรียก LLM คือชื่อของแหล่งข้อมูลและฟังก์ชั่นที่มีอยู่ในระบบ คำถามคือคำถามผู้ใช้ LLM ส่งออกรายการคำถามย่อยแต่ละรายการมีฟังก์ชั่นและแหล่งข้อมูล

task_1_table

สำหรับคำถามสามตัวอย่าง LLM ส่งคืนผลลัพธ์ต่อไปนี้:

ตารางเอาต์พุต LLM

คำถาม	คำถามย่อย	วิธีการดึงข้อมูล	แหล่งข้อมูล
"ประชากรของชิคาโกคืออะไร"	"ประชากรของชิคาโกคืออะไร"	การดึงเวกเตอร์	ชิคาโก
"ขอสรุปแง่บวกของแอตแลนต้า"	"ขอสรุปแง่บวกของแอตแลนต้า"	สรุปการเรียกคืน	แอตแลนตา
"เมืองใดมีประชากรสูงสุด"	"ประชากรของโตรอนโตคืออะไร"	การดึงเวกเตอร์	โตรอนโต
	"ประชากรของชิคาโกคืออะไร"	การดึงเวกเตอร์	ชิคาโก
	"ประชากรของฮูสตันคืออะไร"	การดึงเวกเตอร์	ฮูสตัน
	"ประชากรของบอสตันคืออะไร"	การดึงเวกเตอร์	บอสตัน
	"ประชากรของแอตแลนต้าคืออะไร"	การดึงเวกเตอร์	แอตแลนตา

ภารกิจที่ 2: การดึงเวกเตอร์/สรุป

สำหรับแต่ละคำถามย่อยเราใช้ฟังก์ชั่นการดึงข้อมูลที่เลือกผ่านแหล่งข้อมูลที่เกี่ยวข้องเพื่อดึงข้อมูลที่เกี่ยวข้อง ตัวอย่างเช่นสำหรับคำถามย่อย "ประชากรของชิคาโกคืออะไร" เราใช้การดึงเวกเตอร์ผ่านแหล่งข้อมูลชิคาโก ในทำนองเดียวกันสำหรับคำถามย่อย "ให้ฉันสรุปด้านบวกของแอตแลนต้า" เราใช้การดึงข้อมูลสรุปผ่านแหล่งข้อมูลแอตแลนตา

สำหรับวิธีการดึงข้อมูลทั้งสองเราใช้แม่แบบพรอมต์ LLM เดียวกัน ในความเป็นจริงเราพบว่า พรอมต์ RAG ยอดนิยมจาก Langchainhub ใช้งานได้ดีนอกกรอบสำหรับขั้นตอนนี้

 -- RAG Prompt Template --

"""
You are an assistant for question-answering tasks. Use the following pieces of retrieved context to answer the question. If you don't know the answer, just say that you don't know. Use three sentences maximum and keep the answer concise.
Question: {question}
Context: {context}
Answer:

ทั้งวิธีการดึงข้อมูลแตกต่างกันในบริบทที่ใช้สำหรับการเรียก LLM เท่านั้น สำหรับการดึงเวกเตอร์เราใช้ชิ้นส่วนข้อมูลที่คล้ายกันมากที่สุด K กับคำถามย่อยเป็นบริบท สำหรับการดึงข้อมูลสรุปเราใช้แหล่งข้อมูลทั้งหมดเป็นบริบท

task_2_table

ภารกิจที่ 3: การรวมการตอบสนอง

นี่เป็นขั้นตอนสุดท้ายที่รวมการตอบสนองจากคำถามย่อยไปสู่การตอบสนองขั้นสุดท้าย ตัวอย่างเช่นสำหรับคำถาม "เมืองใดมีประชากรสูงสุด" คำถามย่อยจะดึงประชากรของแต่ละเมืองจากนั้นตอบสนองการรวมตัวกันพบและส่งคืนเมืองด้วยประชากรสูงสุด Rag Prompt ทำงานได้ดีสำหรับขั้นตอนนี้เช่นกัน

บริบทสำหรับการเรียก LLM คือรายการคำตอบจากคำถามย่อย คำถามคือคำถามผู้ใช้ดั้งเดิมและ LLM ส่งออกการตอบกลับขั้นสุดท้าย

task_3_table

รวมเข้าด้วยกัน

หลังจากคลี่คลายเลเยอร์ของสิ่งที่เป็นนามธรรมเราได้ค้นพบส่วนผสมลับที่ให้กำลังกับเครื่องยนต์สืบค้นแบบสอบถามย่อย - 4 ประเภทของ LLM เรียกแต่ละครั้งด้วยเทมเพลตพรอมต์บริบทและคำถามที่แตกต่างกัน สิ่งนี้เหมาะกับรูปแบบการป้อนข้อมูลสากลที่เราระบุไว้ก่อนหน้านี้อย่างสมบูรณ์แบบและเป็นหนทางไกลจาก abstractions ที่ซับซ้อนที่เราเริ่มต้นด้วย เพื่อสรุป: สมการ call_types_table

หากต้องการดูการดำเนินการไปป์ไลน์เต็มให้เรียกใช้คำสั่งต่อไปนี้:

 pip install -r requirements.txt

echo OPENAI_API_KEY='yourkey' > .env
python complex_qa.py

นี่คือตัวอย่างของระบบที่ตอบคำถาม "เมืองใดที่มีประชากรสูงสุด" -

full_pipeline

ความท้าทาย

ตอนนี้เราได้เข้าใจถึงการทำงานภายในของท่อส่งเศษผ้าขั้นสูงแล้วลองตรวจสอบความท้าทายที่เกี่ยวข้องกับพวกเขา

คำถามความไว - ความท้าทายที่ยิ่งใหญ่ที่สุดที่เราสังเกตเห็นด้วยระบบเหล่านี้คือความไวของคำถาม LLMs มีความอ่อนไหวอย่างมากต่อคำถามผู้ใช้และท่อส่งข้อมูลล้มเหลวอย่างไม่คาดคิดสำหรับคำถามผู้ใช้หลายคำถาม นี่คือตัวอย่างความล้มเหลวบางกรณีที่เราพบ:
- คำถามย่อยที่ไม่ถูกต้อง -บางครั้ง LLM สร้างคำถามย่อยที่ไม่ถูกต้อง ตัวอย่างเช่น "เมืองใดมี บริษัท เทคโนโลยีจำนวนมากที่สุด" แบ่งออกเป็น "บริษัท เทคโนโลยีในแต่ละเมืองคืออะไร" 5 ครั้ง (ครั้งเดียวสำหรับแต่ละเมือง) แทนที่จะเป็น "บริษัท เทคโนโลยีจำนวนเท่าใดในโตรอนโต" , "What is the number of tech companies in Chicago?" ฯลฯ
- ฟังก์ชั่นการดึงข้อมูลที่ไม่ถูกต้อง - "สรุปแง่บวกของแอตแลนต้าและโตรอนโต" ผลลัพธ์ในการใช้ฟังก์ชันการดึงเวกเตอร์แทนวิธีการดึงข้อมูลสรุป

เราต้องใช้ความพยายามอย่างมีนัยสำคัญในการวิศวกรรมที่รวดเร็วเพื่อให้ท่อส่งไปทำงานสำหรับแต่ละคำถาม นี่เป็นความท้าทายที่สำคัญสำหรับการสร้างระบบที่แข็งแกร่ง

ในการตรวจสอบพฤติกรรมนี้เราใช้ตัวอย่างโดยใช้เครื่องมือค้นหาคำถามย่อย LlamaineDex สอดคล้องกับการสังเกตของเราระบบมักจะสร้างคำถามย่อยที่ไม่ถูกต้องและยังใช้ฟังก์ชั่นการดึงข้อมูลผิดสำหรับคำถามย่อยดังที่แสดงด้านล่าง

llama_index_baseline

ค่าใช้จ่าย - ความท้าทายที่สองคือการเปลี่ยนแปลงต้นทุนของท่อส่งเศษผ้าขั้นสูง ปัญหาคือสองเท่า:
- ค่าใช้จ่ายความไว - ค่าใช้จ่ายสุดท้ายของคำถามขึ้นอยู่กับจำนวนคำถามย่อยที่สร้างขึ้นฟังก์ชันการดึงที่ใช้และจำนวนแหล่งข้อมูลที่สอบถาม เนื่องจาก LLMS มีความไวต่อพรอมต์ค่าใช้จ่ายของคำถามอาจแตกต่างกันอย่างมากขึ้นอยู่กับคำถามและเอาต์พุต LLM ตัวอย่างเช่นตัวเลือกโมเดลที่ไม่ถูกต้องในตัวอย่างพื้นฐาน llamaidex ด้านบน ( summary_tool ) ส่งผลให้ต้นทุนสูงกว่า 3x เมื่อเทียบกับ vector_tool ในขณะเดียวกันก็สร้างการตอบสนองที่ไม่ถูกต้อง
- การประมาณค่าใช้จ่าย - abstractions ขั้นสูงในกรอบ RAG ปิดบังค่าใช้จ่ายโดยประมาณของคำถาม การตั้งค่าระบบตรวจสอบต้นทุนเป็นสิ่งที่ท้าทายเนื่องจากค่าใช้จ่ายของคำถามขึ้นอยู่กับเอาต์พุต LLM

บทสรุป

ท่อส่งเศษผ้าขั้นสูงที่ขับเคลื่อนโดย LLM ได้ปฏิวัติระบบการตอบคำถาม อย่างไรก็ตามอย่างที่เราได้เห็นท่อเหล่านี้ไม่ใช่วิธีแก้ปัญหาแบบครบวงจร ภายใต้ฝากระโปรงพวกเขาพึ่งพาแม่แบบพรอมต์ที่ได้รับการออกแบบมาอย่างระมัดระวังและการโทร LLM ที่ถูกล่ามโซ่หลายครั้ง ดังที่แสดงในแอปพลิเคชัน EVADB นี้ท่อเหล่านี้อาจเป็นคำถามที่ไวต่อคำถามเปราะและทึบแสงในการเปลี่ยนแปลงค่าใช้จ่าย การทำความเข้าใจความซับซ้อนเหล่านี้เป็นกุญแจสำคัญในการใช้ประโยชน์จากศักยภาพอย่างเต็มที่และปูทางสำหรับระบบที่แข็งแกร่งและมีประสิทธิภาพมากขึ้นในอนาคต

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-27
ขนาด 3.76MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด