หากคุณใช้การซ่อมแซมในการวิจัยเชิงวิชาการโปรดอ้างถึง "Repairllama: การเป็นตัวแทนที่มีประสิทธิภาพและอะแดปเตอร์ที่ปรับแต่งสำหรับการซ่อมแซมโปรแกรม", รายงานทางเทคนิค, Arxiv 2312.15698, 2023
@techreport { repairllama2023 ,
title = { RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair } ,
author = { Silva, Andr{'e} and Fang, Sen and Monperrus, Martin } ,
url = { http://arxiv.org/abs/2312.15698 } ,
number = { 2312.15698 } ,
institution = { arXiv } ,
}ที่เก็บนี้มีรหัสโมเดลและผลลัพธ์เพื่อทำซ้ำกระดาษ "Repairllama: การเป็นตัวแทนที่มีประสิทธิภาพและอะแดปเตอร์ที่ปรับจูนสำหรับการซ่อมแซมโปรแกรม"
มันมีโครงสร้างดังนี้:
รุ่นที่ปรับแต่งทั้งหมดมีอยู่ใน HuggingFace นี่คือลิงค์เฉพาะ:
ชุดข้อมูลการปรับแต่งที่ผ่านการประมวลผลมีให้ใน HuggingFace ที่ https://huggingface.co/datasets/assert-kth/repairllama-datasets มันมีชุดข้อมูลที่ใช้สำหรับการฝึกอบรมโมเดลซ่อมแซมส่วนย่อยหนึ่งชุดต่อคู่ตัวแทนอินพุต/เอาต์พุต เพื่อให้ได้ชุดข้อมูล 30K..50K เราได้กรองเพิ่มเติมตามความยาวโทเค็นของอินพุต + คู่เอาต์พุตน้อยกว่า 1024 โทเค็น
หากเป็นที่สนใจของคุณคุณสามารถค้นหาสิ่งเหล่านี้ได้ที่ Huggingface org ของเรา:
เกณฑ์มาตรฐานการประเมินคือข้อบกพร่อง 4J V2, Humaneval-Java และ Gitbug-Java
เรามุ่งเน้นไปที่ข้อบกพร่องเดี่ยวฟังก์ชั่น (เช่นข้อบกพร่องที่มีแพตช์นักพัฒนาซอฟต์แวร์เปลี่ยนฟังก์ชั่นเดียวเท่านั้น):
โปรดทราบว่า Humaneval-Java ดั้งเดิมมีข้อผิดพลาดที่ซ้ำกัน