Unduh repairllama - Unduh Kode Sumber repairllama

repairllama

Kode Sumber AI

1.0.0

Unduh

Repairllama: Representasi yang efisien dan adaptor yang disesuaikan untuk perbaikan program

Jika Anda menggunakan Repairllama dalam penelitian akademik, silakan kutip "Repairllama: Representasi yang efisien dan adaptor yang disesuaikan untuk perbaikan program", Laporan Teknis, ARXIV 2312.15698, 2023.

 @techreport { repairllama2023 ,
  title = { RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair } ,
  author = { Silva, Andr{'e} and Fang, Sen and Monperrus, Martin } ,
  url = { http://arxiv.org/abs/2312.15698 } ,
  number = { 2312.15698 } ,
  institution = { arXiv } ,
}

Repositori ini berisi kode, model, dan hasil untuk mereplikasi kertas "Repairllama: Representasi yang efisien dan adaptor yang disesuaikan untuk perbaikan program"

Itu disusun sebagai berikut:

Repairllama-Lora berisi adaptasi peringkat rendah Codellama-7b, yang disebut "Adaptor Perbaikan"
Hasil berisi semua tambalan yang dihasilkan untuk cacat4j dan humaneval-java oleh semua model (termasuk fine-tuning penuh, LORA, dan representasi kode)
SRC berisi skrip pelatihan dan inferensi, dan skrip untuk menghasilkan kumpulan data untuk representasi input-output yang berbeda (IRXOR)
Contohnya berisi contoh notebook yang menjelaskan cara memuat dan meminta model perbaikan yang
Benchmark berisi set data untuk representasi input-output yang berbeda (IRXOR)

Model

Semua model fine-tuned tersedia di Huggingface, berikut adalah tautan khusus:

Ir1xor1: https://huggingface.co/assert-kth/repairllama-ir1-or1
Ir1xor3: https://huggingface.co/assert-kth/repairllama-ir1-or3
Ir1xor3: https://huggingface.co/assert-kth/repairllama-ir1-or4
Ir2xor2: https://huggingface.co/assert-kth/repairllama-ir2-or2
Ir3xor2: https://huggingface.co/assert-kth/repairllama-ir3-or2

Kumpulan data

Kumpulan data penyempurnaan yang diproses tersedia di Huggingface di https://huggingface.co/datasets/assert-kth/repairllama-datasets. Ini berisi set data yang digunakan untuk melatih model Repairllama, satu subset per pasangan representasi input/output. Untuk mendapatkan dataset 30K..50K, kami melakukan penyaringan lebih lanjut berdasarkan token panjang input + pasangan output yang kurang dari 1024 token.

Jika menarik minat Anda, Anda juga dapat menemukannya di org huggingface kami:

Megadiff (dataset asli, dalam format HF): https://huggingface.co/datasets/assert-kth/megadiff
Fungsi tunggal Megadiff (hanya fungsi fungsi, dengan fungsi buggy dan tetap diekstraksi darinya): https://huggingface.co/datasets/assert-kth/megadiff-single-function