ดาวน์โหลด LoGU - ดาวน์โหลดซอร์สโค้ด LoGU

LoGU

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

logu: รุ่นยาวที่มีการแสดงออกที่ไม่แน่นอน

Ruihan Yang ¹ Caiqi Zhang ² Zhisong Zhang ³

¹ มหาวิทยาลัย Fudan

² มหาวิทยาลัยเคมบริดจ์

³ Tencent AI Lab

การแนะนำ

ในขณะที่แบบจำลองภาษาขนาดใหญ่ (LLMS) แสดงให้เห็นถึงความสามารถที่น่าประทับใจพวกเขายังคงต่อสู้กับการสร้างเนื้อหาที่ไม่ถูกต้องตามความเป็นจริง (เช่นภาพหลอน) วิธีการที่มีแนวโน้มในการบรรเทาปัญหานี้คือการเปิดใช้งานแบบจำลองเพื่อแสดงความไม่แน่นอนเมื่อไม่แน่ใจ การวิจัยก่อนหน้านี้เกี่ยวกับการสร้างแบบจำลองความไม่แน่นอนได้มุ่งเน้นไปที่ QA ระยะสั้นเป็นหลัก แต่แอปพลิเคชันในโลกแห่งความเป็นจริงมักต้องการการตอบสนองที่ยาวนานขึ้น ในงานนี้เราแนะนำภารกิจของการสร้างแบบยาวด้วยความไม่แน่นอน (logu) เราระบุความท้าทายที่สำคัญสองประการคือ การปราบปรามความไม่แน่นอน ซึ่งแบบจำลองลังเลที่จะแสดงความไม่แน่นอนและ การเยื้องศูนย์ไม่แน่นอน ซึ่งแบบจำลองถ่ายทอดความไม่แน่นอนอย่างไม่ถูกต้อง

เพื่อจัดการกับความท้าทายเหล่านี้เราเสนอกรอบการรวบรวมข้อมูลแบบปรับแต่งและท่อฝึกอบรมสองขั้นตอน กรอบการทำงานของเราใช้กลยุทธ์การแบ่งแยกและพิชิตการปรับความไม่แน่นอนตามการเรียกร้องของอะตอม ข้อมูลที่เก็บรวบรวมจะถูกใช้ในการฝึกอบรมผ่านการปรับแต่งการปรับแต่ง (SFT) และการเพิ่มประสิทธิภาพการตั้งค่าโดยตรง (DPO) เพื่อเพิ่มการแสดงออกที่ไม่แน่นอน การทดลองอย่างกว้างขวางเกี่ยวกับการเรียนการสอนแบบยาวสามชุดตามชุดข้อมูลแสดงให้เห็นว่าวิธีการของเราช่วยเพิ่มความแม่นยำอย่างมีนัยสำคัญลดภาพหลอนและรักษาความครอบคลุมของการตอบสนอง

วิธีการติดตั้ง

คุณสามารถใช้คำสั่งต่อไปนี้เพื่อติดตั้งสภาพแวดล้อมสำหรับ logu:

conda create -n LoGU python==3.8
conda activate LoGU
pip install -r lf_requirements.txt
pip install -r vllm_requirements.txt

วิ่ง

ลองใช้คำสั่งต่อไปนี้เพื่อทดสอบวิธีการของเราเกี่ยวกับ BIOS, LongFact, Wildhallu:

สร้างคำตอบ

 cd ./scripts
bash generate_vllm_responses.sh

คำนวณความถูกต้องตามข้อเท็จจริง (FA)

bash eval_pipeline.sh

คำนวณความแม่นยำที่ไม่แน่นอน (UC)

bash generate_unc_answers.sh
bash factcheck_unc_answers.sh

ข้อมูลการฝึกอบรม

เร็วๆ นี้!

นอกจากนี้เรายังให้แบบจำลองการแสดงออกที่ไม่แน่นอนบนฮับโมเดล HuggingFace สำหรับ Fast Trail:

แบบอย่าง	การเชื่อมโยง
rhyang2021/unclem_llama3_8b	กอด
rhyang2021/unclem_mistral_7b	กอด

หากคุณมีคำถามใด ๆ โปรดส่งอีเมลถึงฉันหรือส่งปัญหาให้ฉัน

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-11
ขนาด 2.66MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด