تنزيل LoGU - تنزيل رمز المصدر LoGU

LoGU

كود الذكاء الاصطناعي

1.0.0

تنزيل

لوجو: جيل طويل الشكل مع تعبيرات عدم اليقين

Ruihan Yang ¹ Caiqi Zhang ² Zhisong Zhang ³

¹ جامعة فودان

² جامعة كامبريدج

³ Tencent AI Lab

مقدمة

في حين أن نماذج اللغة الكبيرة (LLMS) تُظهر قدرات رائعة ، إلا أنها لا تزال تكافح مع توليد محتوى غير صحيح في الواقع (أي الهلوسة). إن النهج الواعد للتخفيف من هذه المشكلة هو تمكين النماذج من التعبير عن عدم اليقين عندما غير متأكد. ركزت الأبحاث السابقة حول نمذجة عدم اليقين في المقام الأول على ضمان الجودة القصير ، ولكن التطبيقات في العالم الحقيقي تتطلب غالبًا استجابات أطول بكثير. في هذا العمل ، نقدم مهمة توليد النمط الطويل مع عدم اليقين (LOGU). نحدد التحديين الرئيسيين: قمع عدم اليقين ، حيث تتردد النماذج في التعبير عن عدم اليقين ، واختلاف عدم اليقين ، حيث تنقل النماذج عدم اليقين بشكل غير دقيق.

لمعالجة هذه التحديات ، نقترح إطار عمل لجمع البيانات القائم على التحسين وخط أنابيب تدريب على مرحلتين. يتبنى إطار عملنا استراتيجية للفجوة والقوس ، وتحسين عدم اليقين بناءً على المطالبات الذرية. ثم يتم استخدام البيانات التي تم جمعها في التدريب من خلال الضبط الخاضع للإشراف (SFT) وتحسين التفضيل المباشر (DPO) لتعزيز تعبير عدم اليقين. تُظهر تجارب مكثفة على ثلاثة تعليمات طويلة الشكل بعد مجموعات البيانات أن طريقتنا تحسن بشكل كبير من الدقة ، وتقلل من الهلوسة ، وتحافظ على شمولية الاستجابات.

كيفية التثبيت

يمكنك استخدام الأوامر التالية لتثبيت البيئة لـ LOGU:

conda create -n LoGU python==3.8
conda activate LoGU
pip install -r lf_requirements.txt
pip install -r vllm_requirements.txt

يجري

جرب الأمر التالي لاختبار طريقتنا على BIOS ، Longfact ، Wildhallu:

توليد إجابات

 cd ./scripts
bash generate_vllm_responses.sh

حساب الدقة الواقعية (FA)

bash eval_pipeline.sh

حساب الدقة غير المؤكدة (UC)

bash generate_unc_answers.sh
bash factcheck_unc_answers.sh

بيانات التدريب

قريباً!

نحن نقدم أيضًا بعض نماذج تعبير عدم اليقين على محور نموذج Huggingface للدرب السريع:

نموذج	وصلة
rhyang2021/uncurner_llama3_8b	luggingface
rhyang2021/uncurner_mistral_7b	luggingface

إذا كان لديك أي أسئلة ، فلا تتردد في مراسلتي عبر البريد الإلكتروني أو إسقاط مشكلة.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-11
الحجم 2.66MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل