تنزيل bocoel - تنزيل رمز المصدر bocoel

bocoel

كود الذكاء الاصطناعي

1.0.0

تنزيل

☂ بوكويل

تحسين بايزي كأداة تغطية لتقييم نماذج اللغة الكبيرة

؟ لماذا بوكويل؟

نماذج اللغة الكبيرة باهظة الثمن وبطيئة ، وتقييمها على مجموعات البيانات الحديثة العملاقة تجعل الأمر أسوأ.

إذا كانت هناك طريقة فقط لتحديد مجموعة فرعية ذات معنى ( وصغيرة ) من المجموعة والحصول على تقييم دقيق للغاية .....

انتظر ، يبدو مثل تحسين بايزي!

يعمل Bocoel في الخطوات التالية:

قم بتشفير الدخول الفردي في التضمينات (أرخص طريقة / أسرع من LLM وقابلة لإعادة الاستخدام).
استخدم تحسين Bayesian لتحديد الاستعلامات لتقييم.
استخدم الاستعلامات لاسترداد من مجموعةنا (مع التضمينات المشفرة).
ربح.

يمكن إدارة التقييمات التي تم إنشاؤها بسهولة بواسطة الأداة المساعدة المدير المقدم.

على حد علمنا ، هذا هو أول عمل يهدف إلى تقليل تكاليف الحساب أثناء التقييم (القياس) بميزانية (ربما ديناميكية).

سمات

قم بتقييم نماذج لغة كبيرة بدقة مع عشرات العينات فقط من المجموعة التي اخترتها.
يستخدم "قوة تحسين بايزي" لتحديد مجموعة فرعية مثالية من العينات لنموذج اللغة لتقييمها.
؟ تقييم المجموعة على النموذج بالإضافة إلى تقييم النموذج على الجسم.
؟ دعم GPT2 و Pythia و LLAMA والمزيد من خلال التكامل مع محولات Huggingface ومجموعات البيانات
؟ تصميم وحدات.
؟ تمثيل فعال لمجموعة Corpus / Dataset مثل تمثيل N-sphere أو تبييض المساحة الكامنة لزيادة جودة التقييم.

أعطنا نجمًا!

مثل ما تراه؟ يرجى النظر في إعطاء هذا نجم (★)!

♾ تحسين بايزي

ببساطة ، يهدف تحسين Bayesian إلى تحسين هدف الاستكشاف (المنطقة الأرجواني في الصورة) أو كائن الاستغلال (ارتفاع النقاط السوداء). يستخدم العمليات الغوسية كعمود خارجي للاستدلال ، ويستخدم وظيفة الاستحواذ لتحديد مكان عينة بعد ذلك. انظر هنا للحصول على مقدمة أكثر تعمقا.

نظرًا لأن تحسين Bayesian يعمل بشكل جيد مع نموذج صندوق أسود باهظ التكلفة (Paraphrase: LLM) ، فهو مثالي لحالة الاستخدام هذه. يستخدم Bocoel تحسين Bayesian باعتباره العمود الفقري لاستكشاف مساحة التضمين التي قدمها Corpus ، والتي تتيح لها اختيار مجموعة فرعية جيدة تتصرف كقطعة صغيرة من المجموعة.

آثار الأداء

LLMs بطيئة بشكل مؤلم ، وخاصة تلك التوليدية (وهو ما يشار إليه عادة باسم LLM) ، لأن توليد التسلسل متسلسل بطبيعته.

على الرغم من متطلبات bocoel لاستخدام أحد التضمين لتشفير المجموعة بأكملها ، فإن التضمين أسرع من LLMs حسب أوامر الحجم ويتم اكتساب الوقت مرة أخرى من خلال أي مدخرات في تقييم LLMs.

تثبيت

لا أريد تبعيات اختيارية:

 pip install bocoel

أعطني التجربة الكاملة (جميع التبعيات الاختيارية):

 pip install "bocoel[all]"

؟ الاستخدام

راجع أمثلة المجلد/getting_started لاستخدام مبسط للمكتبة للبدء مع بضعة أسطر من التعليمات البرمجية.

✍ تطوير مع بوكويل

أمثلة الاستخدام تحت examples المجلد. يمكن العثور على مرجع API هنا.

؟ المساهمة

أراد المساهمون! لا تخجل. لا تتردد في تقديم المشكلات و PRS. بالنسبة إلى PRS ، يرجى اتباع دليل المساهمة وقواعد السلوك. تؤخذ الانفتاح والشمولية على محمل الجد.

خارطة الطريق: العمل قيد التقدم

؟ استخدام أبسط. يجب أن أقدم غلافًا عالي المستوى لتقييمات المكتبة بأكملها يمكن تشغيلها في سطر واحد.
وحدة التصور من التقييم.
؟ تكامل الأساليب البديلة (عشوائية ، kmedoids ...) مع عملية غوسية.
؟ التكامل مع المزيد من الخلفية مثل VLLM و Openai API.
؟ دعم Python 3.12+

؟ ️ الترخيص والاستشهاد

الرمز متاح بموجب ترخيص BSD-3.

إذا وجدت هذا المشروع مفيدًا في بحثك ، فيرجى الاستشهاد بهذا العمل

 @misc{bocoel2024,
    title = {BoCoEL: Bayesian Optimization as a Coverage Tool for Evaluating Large Language Models},
    url = {https://bocoel.rentruewang.com/research/},
    author = {Wang, RenChu},
    month = {January},
    year = {2024}
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-08
الحجم 340.08KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل