repairllama Download - repairllama Quellcode Download

repairllama

AI-Quellcode

1.0.0

Herunterladen

Reparaturlamlama: Effiziente Darstellungen und fein abgestimmte Adapter für die Programmreparatur

Wenn Sie Repairllama in der akademischen Forschung verwenden, zitieren Sie bitte "Reparaturllama: Effiziente Darstellungen und fein abgestimmte Adapter für die Programmreparatur", Technischer Bericht, ARXIV 2312.15698, 2023.

 @techreport { repairllama2023 ,
  title = { RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair } ,
  author = { Silva, Andr{'e} and Fang, Sen and Monperrus, Martin } ,
  url = { http://arxiv.org/abs/2312.15698 } ,
  number = { 2312.15698 } ,
  institution = { arXiv } ,
}

Dieses Repository enthält den Code, das Modell und die Ergebnisse, um das Papier "Repairlama: Effiziente Darstellungen und fein abgestimmte Adapter für die Programmreparatur" zu replizieren.

Es ist wie folgt strukturiert:

Reparaturlamlama-Lora enthält die Reparaturlame mit niedriger Anpassung von Codellama-7b mit dem Titel "Reparaturadapter", der als "Reparaturadapter" bezeichnet wird.
Die Ergebnisse enthält alle erzeugten Patches für Defekte4j und Humaneval-Java durch alle Modelle (einschließlich der vollständigen Feinabstimmung, Lora und Code-Darstellungen)
SRC enthält die Schulungs- und Inferenzskripte sowie Skripte, um Datensätze für verschiedene Eingabe-Output-Darstellungen zu generieren (IRXOR)
Beispiel enthält ein Beispiel Notizbuch, das erklärt, wie das Reparaturlame -Modell geladen und aufgefordert wird
Benchmarks enthält die Datensätze für verschiedene Eingabe-Output-Darstellungen (IRXOR)

Modelle

Alle fein abgestimmten Modelle sind auf Huggingface erhältlich. Hier finden Sie spezifische Links:

IR1XOR1: https://huggingface.co/assert-kth/repairllama-ir1-or1
IR1XOR3: https://huggingface.co/assert-kth/repairllama-ir1-or3
IR1XOR3: https://huggingface.co/assert-kth/repairllama-ir1-or4
IR2XOR2: https://huggingface.co/assert-kth/repairllama-ir2-or2
IR3XOR2: https://huggingface.co/assert-kth/repairllama-ir3-or2

Datensätze

Die verarbeiteten feinstimmenden Datensätze werden auf dem Umarmungsface unter https://huggingface.co/datasets/assert-KTH/Repairllama-Datasets verfügbar gemacht. Es enthält die Datensätze, die für das Training der Reparaturlamlama -Modelle verwendet werden, eine Teilmenge pro Eingangs-/Ausgangsdarstellungspaar. Um die 30k..50K -Datensätze zu erhalten, filterten wir weiter, basierend auf der Token -Länge der Eingang + Ausgangspaare, die weniger als 1024 Token sind.

Wenn es Sie interessiert, können Sie diese auch auf unserer Umarmung finden:

Megadiff (Originaldatensatz im HF-Format): https://huggingface.co/datasets/assert-KTH/Megadiff
Megadiff Einzelfunktion (nur Einzelfunktionen diffs, mit fehlerhaften und festen Funktionen, die daraus extrahiert werden): https://huggingface.co/datasets/assert-kth/megadiff-single-funktion