RAG Retrieval Augmented Generation ดาวน์โหลด - RAG Retrieval Augmented Generation Source Download Download

RAG Retrieval Augmented Generation

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

ผ้าขี้ริ้ว - รุ่นเพิ่มการดึง

ใช้ Watsonx เพื่อตอบคำถามภาษาธรรมชาติโดยใช้วิธี RAG

โน้ตบุ๊กนี้มีขั้นตอนและรหัสเพื่อแสดงการสนับสนุนการดึงรุ่นเพิ่มใน watsonx.ai มันแนะนำคำสั่งสำหรับการดึงข้อมูลการสร้างฐานความรู้และการสืบค้นและการทดสอบแบบจำลอง

วัตถุประสงค์

ใช้โมเดล LLM, Langchain และ Milvus เพื่อสร้างระบบ Augmented Generation (RAG) สิ่งนี้จะช่วยให้เราถามคำถามเกี่ยวกับเอกสารของเรา (ที่ไม่รวมอยู่ในข้อมูลการฝึกอบรม) โดยไม่ต้องปรับรูปแบบภาษาขนาดใหญ่ (LLM) เมื่อใช้ RAG หากคุณได้รับคำถามคุณทำขั้นตอนการดึงข้อมูลเพื่อดึงเอกสารที่เกี่ยวข้องจากฐานข้อมูลพิเศษฐานข้อมูลเวกเตอร์ที่เอกสารเหล่านี้ถูกจัดทำดัชนี

Retrieval Augmented Generation (RAG) เป็นรูปแบบอเนกประสงค์ที่สามารถปลดล็อกกรณีการใช้งานจำนวนมากที่ต้องเรียกคืนข้อมูลจริงเช่นการสืบค้นฐานความรู้ในภาษาธรรมชาติ

คำจำกัดความ:

LLM - รูปแบบภาษาขนาดใหญ่
Langchain - กรอบการทำงานที่ออกแบบมาเพื่อทำให้การสร้างแอปพลิเคชันง่ายขึ้นโดยใช้ LLMS
ฐานข้อมูล Vector - ฐานข้อมูลที่จัดระเบียบข้อมูลผ่านเวกเตอร์ที่มีการลดทอนสูง
Milvus - ฐานข้อมูลเวกเตอร์
Rag - Generation Augmented Retrieval (ดูรายละเอียดเพิ่มเติมเกี่ยวกับ Rags) ด้านล่าง)

ระบบ Augmented Generation (RAG) การดึงข้อมูลคืออะไร?

แบบจำลองภาษาขนาดใหญ่ (LLMS) ได้พิสูจน์ความสามารถในการทำความเข้าใจบริบทและให้คำตอบที่แม่นยำสำหรับงาน NLP ต่างๆรวมถึงการสรุปคำถามและคำตอบเมื่อได้รับแจ้ง ในขณะที่สามารถให้คำตอบที่ดีมากสำหรับคำถามเกี่ยวกับข้อมูลที่พวกเขาได้รับการฝึกฝนพวกเขามักจะเห็นภาพหลอนเมื่อหัวข้อเกี่ยวกับข้อมูลที่พวกเขาทำ "ไม่รู้" เช่นไม่รวมอยู่ในข้อมูลการฝึกอบรมของพวกเขา Generation Augmented Retrieval รวมทรัพยากรภายนอกเข้ากับ LLMs องค์ประกอบหลักสองประการของผ้าขี้ริ้วจึงเป็นรีทรีฟเวอร์และเครื่องกำเนิดไฟฟ้า

ส่วน Retriever สามารถอธิบายได้ว่าเป็นระบบที่สามารถเข้ารหัสข้อมูลของเราเพื่อให้สามารถดึงส่วนที่เกี่ยวข้องของมันได้อย่างง่ายดาย การเข้ารหัสทำได้โดยใช้การฝังข้อความเช่นโมเดลที่ได้รับการฝึกฝนเพื่อสร้างการแสดงเวกเตอร์ของข้อมูล ตัวเลือกที่ดีที่สุดสำหรับการใช้งานรีทรีฟเวอร์คือฐานข้อมูลเวกเตอร์ ในฐานะฐานข้อมูลเวกเตอร์มีหลายตัวเลือกทั้งโอเพนซอร์สหรือผลิตภัณฑ์เชิงพาณิชย์ ตัวอย่างไม่กี่อย่างคือ Chromadb, Mevius, Faiss, Pinecone, Weaviate ตัวเลือกของเราในสมุดบันทึกนี้จะเป็นอินสแตนซ์ท้องถิ่นของ Chromadb (ถาวร)

สำหรับชิ้นส่วนเครื่องกำเนิดไฟฟ้าตัวเลือกที่ชัดเจนคือ LLM ในสมุดบันทึกนี้เราจะใช้โมเดล LLAMA V2 เชิงปริมาณจากคอลเลกชันโมเดล Kaggle

การประสานของรีทรีฟเวอร์และเครื่องกำเนิดไฟฟ้าจะทำโดยใช้ Langchain ฟังก์ชั่นพิเศษจาก Langchain ช่วยให้เราสามารถสร้างเครื่องสร้างเครื่องรับสัญญาณในรหัสบรรทัดเดียว

ในรูปแบบที่ง่ายที่สุดผ้าขี้ริ้วต้องการ 3 ขั้นตอน:

ดัชนีความรู้ฐานฐาน (หนึ่งครั้ง)
ดึงข้อความที่เกี่ยวข้องจากฐานความรู้ (สำหรับแบบสอบถามผู้ใช้ทุกคน)
สร้างการตอบสนองโดยการให้อาหารที่ดึงมาเป็นรูปแบบภาษาขนาดใหญ่ (สำหรับแบบสอบถามผู้ใช้ทุกคน)

ข้อมูล:

ฐานความรู้:

690,000 คำที่คุ้มค่าของข้อความที่ทำความสะอาดจาก Wikipedia

ชุดข้อมูลรถไฟและทดสอบ:

มีไฟล์คำถามสามไฟล์หนึ่งไฟล์สำหรับนักเรียนในแต่ละปี: S08, S09 และ S10

ไฟล์ "questionanswerpairs.txt" มีทั้งคำถามและคำตอบ คอลัมน์ในไฟล์นี้มีดังนี้:

Articletitle เป็นชื่อของบทความ Wikipedia ที่มีคำถามและคำตอบเริ่มแรกมา
คำถามคือคำถาม
คำตอบคือคำตอบ
ความยากลำบากจากการจัดอันดับความยากลำบากที่กำหนดไว้สำหรับคำถามตามที่กำหนดให้กับนักเขียนคำถาม
ความยากลำบากในการจัดอันดับความยากลำบากคือความยากลำบากที่กำหนดโดยบุคคลที่ประเมินและตอบคำถามซึ่งอาจแตกต่างจากความยากลำบากในฟิลด์ 4
บทความไฟล์เป็นชื่อของไฟล์ที่มีบทความที่เกี่ยวข้อง

คำถามที่ถูกตัดสินว่ายากจนถูกทิ้งจากชุดข้อมูลนี้

มีหลายบรรทัดหลายบรรทัดที่มีคำถามเดียวกันซึ่งปรากฏขึ้นหากคำถามเหล่านั้นได้รับคำตอบจากบุคคลหลายคน https://www.kaggle.com/rtatman/questionanswer-dataset

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-05-26
ขนาด 8.85MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
ความท้าทายของ Generation Zero CODEX

2022-11-02
Generation Zero - ความไม่สงบบนเทือกเขาแอลป์

2022-08-20

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด