تنزيل PPOCoder - تنزيل رمز المصدر PPOCoder

PPOCoder

كود الذكاء الاصطناعي

1.0.0

تنزيل

ppocoder

التنفيذ الرسمي لتوليد الكود القائم على التنفيذ باستخدام التعلم التعزيز العميق

ملخص

أظهر استخدام نماذج لغة البرمجة (PL) ، التي تم تجهيزها على شركة الكود على نطاق واسع ، كوسيلة لأتمتة عمليات هندسة البرمجيات إمكانات كبيرة في تبسيط مهام توليد الكود المختلفة مثل إكمال الكود وترجمة الكود وتوليف البرنامج. ومع ذلك ، فإن الأساليب الحالية تعتمد بشكل أساسي على أهداف الضبط الخاضعة للإشراف المستعارة من توليد النص ، وإهمال ميزات محددة على مستوى التسلسل من الكود ، بما في ذلك على سبيل المثال لا الحصر الترجيح وكذلك الصواب النحوي والوظيفي. لمعالجة هذا القيد ، نقترح PPOCODER ، وهو إطار جديد لتوليد الكود يجمع بين نماذج PL PRESED مع تحسين السياسة القريبة (PPO) التعلم العميق التعزيز ويستخدم ملاحظات التنفيذ كمصدر خارجي للمعرفة في تحسين النموذج. PPOCODER قابلة للتحويل عبر مهام توليد الكود المختلفة و PLS.

نظرة عامة على PPOCODER مع النماذج الفاعلة والناقد : يتم أخذ عينات من الإجراء من السياسة بناءً على بيانات المصدر المحدد $ x $ (NL أو PL). بعد ذلك ، يتم الحصول على مكافأة لكل إجراء لتوجيه تحديثات سياسة السياسة والتحكم فيها. تتكون وظيفة المكافأة من أربعة عناصر: (أ) ردود الفعل المترجم ؛ (ب) درجة المطابقة النحوية على أساس ASTS ؛ (ج) درجة المطابقة الدلالية على أساس DFGS ؛ و (د) عقوبة الاختلاف KL بين السياسة النشطة والنموذج المرجعي قبل. تقدر نموذج الناقد القيمة استنادًا إلى المكافأة التي تم الحصول عليها وسيتم تحسين PPOCODER مع PPO ، والتي تأخذ في الاعتبار كل من القيمة والسياسة تحسين.

تثبيت البيئة

لتشغيل الرمز ، قم بتثبيت التبعيات في المتطلبات.

 pip install -r requirements.txt

مجموعات البيانات

نقوم بتقييم نماذج/تقييم على معايير مجموعة البيانات الرئيسية التالية لمهام توليد الكود المختلفة:

CodesearchNet (CSN) متاح هنا
XLCOST متاح هنا
التطبيقات متوفرة هنا
MBPP متاح هنا

نقوم بتعامل مع المعالجة المسبقة للبيانات ونبني تسلسل الإدخال/الإخراج بنفس الطريقة الموضحة في الأوراق المرجعية الأصلية. قم بفك الضغط ووضع جميع المعايير في مجلد data .

يجري

لقد أنشأنا برنامج run.sh لتنفيذ صقل طراز PL المستند إلى PPO استنادًا إلى إشارة التحويل البرمجي. لتشغيل البرنامج النصي لمهام توليد الكود المختلفة ، قم بتكوين المعلمات التالية:

حدود	وصف	مثال القيم
`l1`	لغة المصدر	جافا
`l2`	اللغة المستهدفة	CPP
`asp`	حجم مساحة العمل	5
`ns`	عدد العينات الاصطناعية	10
`data_path`	مسار إلى عينات البيانات الأصلية	البيانات/XLCOST/JAVA-CPP/
`output_path`	مسار لإنقاذ الأجيال والمخرجات	Save_results/Java-CPP/
`baseline_output_dir`	المسار إلى القاعدة codet5 (قبل RL) مخرجات	خطوط الأساس/Save_Models/Java-CPP/
`load_model_path`	مسار إلى نموذج CODET5 الأساسي (قبل RL) لكل مهمة المصب	baselines/save_models/java-cpp/pytorch_model.bin
`max_source_length`	طول المصدر Maxmim	400
`max_target_length`	طول الهدف ماكسميم	400
`train_batch_size`	حجم دفعة تدريب	32
`test_batch_size`	اختبار حجم الدُفعة	48
`lr`	معدل التعلم	1E-6
`kl_coef`	المعامل الأولي لعقوبة التباعد KL في المكافأة	0.1
`kl_target`	هدف KL الذي يتحكم بشكل تكيفي في معامل KL	1
`vf_coef`	معامل خطأ VF في فقدان PPO	1E-3
`run`	فهرس المدى	1

تشغيل run.sh يحفظ البرامج التي تم إنشاؤها في ملف .txt والأوزان النموذجية في نهاية كل فترة.

اقتباس

إذا وجدت الورقة أو الريبو مفيدة ، فيرجى الاستشهاد بها

 article {shojaee2023ppocoder ،
  العنوان = {توليد الكود المستند إلى التنفيذ باستخدام التعلم العميق} ،
  المؤلف = {Shojaee ، Parshin and Jain ، Aneesh and Tipirneni ، Sindhu and Reddy ، Chandan K} ،
  Journal = {arxiv preprint arxiv: 2301.13816} ،
  السنة = {2023}
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-10
الحجم 8.39MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل