repairllama repairllama

repairllama

AI Исходный код

1.0.0

Скачать

Repairllama: Эффективные представления и тонкие адаптеры для ремонта программы

Если вы используете Repairllama в академических исследованиях, пожалуйста, укажите «Repairllama: эффективные представления и тонкие адаптеры для ремонта программы», Технический отчет, ARXIV 2312.15698, 2023.

 @techreport { repairllama2023 ,
  title = { RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair } ,
  author = { Silva, Andr{'e} and Fang, Sen and Monperrus, Martin } ,
  url = { http://arxiv.org/abs/2312.15698 } ,
  number = { 2312.15698 } ,
  institution = { arXiv } ,
}

Этот репозиторий содержит код, модель и результаты для воспроизведения бумаги «Repairllama: эффективные представления и тонкие адаптеры для ремонта программы»

Это структурировано следующим образом:

Repairllama-Lora содержит адаптацию Codellama-7B с низким уровнем ремонта, называемая «ремонтный адаптер»
Результаты содержит все сгенерированные патчи для Defects4J и Humaneval-Java по всем моделям (в том числе полная точная настройка, LORA и Code Presentions)
SRC содержит сценарии обучения и вывода, а также сценарии для создания наборов данных для различных представлений ввода-вывода (irxor)
Пример содержит пример ноутбука, объясняющий, как загрузить и заправить модель Repairllama
Бессмы содержит наборы данных для различных представлений ввода-вывода (irxor)

Модели

Все тонко настроенные модели доступны на HuggingFace, вот конкретные ссылки:

Ir1xor1: https://huggingface.co/assert-kth/repairllama-ir1-or1
Ir1xor3: https://huggingface.co/assert-kth/repairllama-ir1-or3
Ir1xor3: https://huggingface.co/assert-kth/repairllama-ir1-or4
Ir2xor2: https://huggingface.co/assert-kth/repairllama-ir2-or2
Ir3xor2: https://huggingface.co/assert-kth/repairllama-ir3-or2

Наборы данных

Обработанные наборы данных с тонкой настройкой доступны на Huggingface по адресу https://huggingface.co/datasets/assert-kth/repairllama-datasets. Он содержит наборы данных, используемые для обучения моделей Repairllama, одно подмножество на пару входных/выходных представлений. Чтобы получить наборы данных 30K..50K, мы провели дальнейшую фильтрацию на основе длины токена входных + выходных пар, составляющих менее 1024 токенов.

Если это вас интересует, вы также можете найти их в нашей Org Huggingface Org:

Megadiff (оригинальный набор данных, в формате HF): https://huggingface.co/datasets/assert-kth/megadiff
Однофункция Megadiff (только однофункциональные различия, с багги и фиксированными функциями, извлеченными из него): https://huggingface.co/datasets/assert-kth/megadiff-singlefunt