libsa4py
v0.4.0
LibSA4Py هي مكتبة تحليل ثابتة لـ Python ، والتي تستخرج تلميحات النوع وميزات لتدريب نماذج الاستدلال المستندة إلى ML.
git clone https://github.com/saltudelft/libsa4py.git
cd libsa4py && pip install .
بالنظر إلى مستودعات Python ، قم بتشغيل الأمر التالي لمعالجة ملفات التعليمات البرمجية المصدر وإنشاء مخرجات تنسيق JSON:
libsa4py process --p $REPOS_PATH --o $OUTPUT_PATH --d $DUPLICATE_PATH --j $WORKERS_COUNT --l $LIMIT --c --no-nlp --pyre
وصف:
--p $REPOS_PATH : المسار إلى مجموعة Python أو مجموعة البيانات.--o $OUTPUT_PATH : مسار لتخزين المشاريع المعالجة.--d $DUPLICATE_PATH : مسار إلى ملفات مكررة لمجموعة البيانات المحددة (IE JSONL.GZ FILE التي تنتجها أداة CD4PY). [ خياري ]--s : مسار إلى ملف CSV لتقسيم مجموعة البيانات المحددة. [ خياري ]--j $WORKERS_COUNT : عدد العمال لمعالجة مشاريع. [ اختياري ، افتراضي = لا. من نوى وحدة المعالجة المركزية المتاحة]--l $LIMIT : عدد المشاريع التي سيتم معالجتها. [ خياري ]--c : ما إذا كنت لتجاهل المشاريع المصنعة. [ اختياري ، افتراضي = خطأ]--no-nlp : ما إذا كان لتطبيق تقنيات NLP القياسية على المعرفات المستخرجة. [ اختياري ، افتراضي = صحيح]--pyre : ما إذا كان يجب تشغيل pyre لاستنتاج أنواع المتغيرات للمشاريع المعطاة. [ اختياري ، افتراضي = خطأ]--tc : ما إذا كان لكتابة التعليقات التوضيحية نوع الاختيار في المشاريع. [ اختياري ، افتراضي = خطأ] لدمج جميع المشاريع المعالجة التي تُنظمها JSON في إطار بيانات واحد ، قم بتشغيل الأمر التالي:
libsa4py merge --o $OUTPUT_PATH --l $LIMIT
وصف:
--o $OUTPUT_PATH : مسار للمشاريع المعالجة ، المستخدمة في خطوة المعالجة السابقة.--l $LIMIT : عدد المشاريع المراد دمجها. [ خياري ] لتطبيق أنواع Pyre المستنتجة على المشاريع ، قم بتشغيل الأمر التالي:
libsa4py apply --p $REPOS_PATH --o $OUTPUT_PATH
وصف:
--p $REPOS_PATH : المسار إلى مجموعة Python أو مجموعة البيانات.--o $OUTPUT_PATH : مسار للمشاريع المعالجة ، المستخدمة في خطوة المعالجة السابقة.بعد معالجة كل مشروع ، يتم إنتاج ملف من تنسيق JSON ، والذي تم وصفه هنا.