Download repairllama - download de código -fonte repairllama

repairllama

Código-Fonte de IA

1.0.0

Baixar

Repairllama: representações eficientes e adaptadores ajustados para reparo do programa

Se você usar o Repairllama em pesquisa acadêmica, cite "Reparyllama: representações eficientes e adaptadores ajustados para reparo do programa", Relatório Técnico, ARXIV 2312.15698, 2023.

 @techreport { repairllama2023 ,
  title = { RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair } ,
  author = { Silva, Andr{'e} and Fang, Sen and Monperrus, Martin } ,
  url = { http://arxiv.org/abs/2312.15698 } ,
  number = { 2312.15698 } ,
  institution = { arXiv } ,
}

Este repositório contém o código, o modelo e os resultados para replicar o artigo "Reparo: representações eficientes e adaptadores ajustados para reparo do programa"

Está estruturado da seguinte forma:

Repairllama-Lora contém a adaptação Repairllama de baixo rank de Codellama-7b, chamado "Adaptador de Reparação"
Os resultados contêm todos os patches gerados para defeitos4j e Humaneval-Java por todos os modelos (incl.
O SRC contém os scripts de treinamento e inferência e scripts para gerar conjuntos de dados para diferentes representações de entrada de entrada (IRXOR)
Exemplo contém um notebook de exemplo explicando como carregar e solicitar o modelo Repairllama
Os benchmarks contêm os conjuntos de dados para diferentes representações de entrada e saída (IRXOR)

Modelos

Todos os modelos de ajuste fino estão disponíveis no Huggingface, aqui estão links específicos:

IR1XOR1: https://huggingface.co/assert-kth/repairllama-ir1-or1
IR1XOR3: https://huggingface.co/assert-kth/repairllama-ir1-or3
IR1XOR3: https://huggingface.co/assert-kth/repairllama-ir1-or4
IR2XOR2: https://huggingface.co/assert-kth/repairllama-ir2-or2
IR3XOR2: https://huggingface.co/assert-kth/repairllama-ir3-or2

Conjuntos de dados

Os conjuntos de dados de ajuste fino processado são disponibilizados no HuggingFace em https://huggingface.co/datasets/assert-kth/repairllama-datasets. Ele contém os conjuntos de dados usados para treinar os modelos Repairllama, um subconjunto por par de representação de entrada/saída. Para obter os conjuntos de dados de 30k..50k, fizemos ainda mais a filtragem com base no comprimento do token dos pares de entrada + saída, sendo menores de 1024 tokens.

Se isso lhe interessa, você também pode encontrá -los em nossa organização Huggingface:

Megadiff (conjunto de dados original, em formato HF): https://huggingface.co/datasets/assert-kth/megadiff
Megadiff Função única (apenas diferencia de função única, com funções de buggy e corrigidas extraídas): https://huggingface.co/datasets/assert-kth/megadiff-tingle-fingfunction