
مشروع | ورقة | الوثائق
Gundam هو مدير بيانات يستخدم نماذج اللغة لمعالجة البيانات النصية بكفاءة ، والتي تم تصميمها على Pytorch. Gundam هو:
Gundam هو إطار عمل جديد لإدارة البيانات يقيس كفاية وضرورة توصيل المظاهرات المشروطة على نماذج اللغة. نوضح أنه يمكن تشغيل الكفاءة المقترحة والضرورة في كل من حالات العرض التوضيحي (أي ، مستوى المثيل) ومجموعات العرض التوضيحي (أي المستوى المحدد). وبالتالي ، يمكن اعتبار مجموعة من بيانات المكونات الإضافية الكافية والضرورية ، التي تم تسميتها كمجموعة مكونات إضافية ذهبية ، مجموعة أساسية بما في ذلك العينات المفيدة. نظرًا لأن التعداد وقياس جميع المجموعات الفرعية الممكنة أمر غير ممكن ، فإننا نقوم بتصميم خوارزميات بحث جديدة قائمة على الأشجار لاستخراج مجموعة الإضافات الذهبية. لاحظ أن مجموعة الإضافات الذهبية يمكن حسابها وتخزينها مسبقًا لتوفير تكاليف الحساب عبر الإنترنت. في هذا الصدد ، يمكن أن يؤدي المستردون من المظاهرات غير البارامترية على مجموعة الإضافات الذهبية المخزنة بدلاً من مجموعة البيانات بأكملها ، لتجنب استرداد المظاهرات غير الكافية أو غير الضرورية. علاوة على ذلك ، بالنظر إلى أن العديد من بيانات البيانات الحقيقية ستستمر في النمو ، فإننا نطور خوارزمية تحديث تدريجية لتجنب إعادة حساب Gundam على جميع الأجزاء المتغيرة وغير المتغيرة.

تتمثل الميزة الهامة لـ Gundam في أنه يمكن نشر Gundam بسهولة على أي منصة لإدارة البيانات الحالية لأن الفكرة الأساسية لـ Gundam هي تعيين مستويات ذات أولوية مختلفة للبيانات المخزنة لإظهار صفات البيانات الخاصة بهم فيما يتعلق بنموذج اللغة المحدد.
@software { GUNDAM ,
author = { Jiarui Jin, Yuwei Wu, Mengyue Yang, Xiaoting He, Weinan Zhang, Yiming Yang, Yong Yu, and Jun Wang } ,
title = { GUNDAM: A Data-Centric Manager for Your Plug-in Data with Language Models } ,
year = { 2023 } ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
version = { 0.0 } ,
howpublished = { url{https://github.com/GUNDAM-Labet/GUNDAM} } ,
}المطورين الأساسيون لنظام Gundam هم Jiarui Jin و Yuwei Wu و Mengyue Yang.
يتم إصدار Gundam بموجب ترخيص Apache ، الإصدار 2.0.