LLM finetune vuln detection Download - LLM finetune vuln detection download do código fonte

LLM finetune vuln detection

Código-Fonte de IA

1.0.0

Baixar

Replicação da pesquisa: LLM Tuneamento fino para detecção de vulnerabilidade de código

Autores: Yong-Hwan Lee, James Flora, Shijie Zhao e Yuns Qiao

Visão geral

Este projeto se replica e se baseia no estudo de Shestov et al. (2024) , com o objetivo de validar e estender suas descobertas. A pesquisa original se concentrou em grandes modelos de idiomas (LLMS) para detecção de vulnerabilidades de código. A abordagem utilizou LoRA (adaptação de baixo rank), uma técnica que envolve a adição de adaptadores dentro de camadas para ajuste fino. Durante esse processo, os parâmetros originais do modelo são congelados e apenas os adaptadores são treinados, tornando o processo de treinamento mais econômico.

Uma inovação importante do nosso trabalho é a incorporação de nossa adaptação personalizada da QLoRA , que primeiro quantiza o LLM a um bóia de 4 bits , reduzindo significativamente seu tamanho. Por exemplo, o modelo 13B-WizardCoder , originalmente em torno de 26 GB e geralmente exigindo mais de 30 GB de VRAM, é reduzido para aproximadamente 7 GB após a quantização. Após a quantização, a técnica LoRA é aplicada para ajuste fino.

O que é Lora?

Figura 1 : Ilustração do adaptador Lora

A Figura 1 ilustra como os adaptadores LORA podem ser significativamente menores que os tamanhos de parâmetros originais. O número de parâmetros para o $ A $ adaptador é $ r times k $ , e para o $ B $ adaptador, é $ d times r $ . Considerando a matriz de parâmetro original é $ d times k $ , onde ambos $ d $ e $ k $ são geralmente grandes para LLMs, escolhendo um pequeno $ r $ pode efetivamente reduzir o número de parâmetros. Assim, a matriz original $ W in mathbb {r}^{d times k} $ é muito maior que o tamanho combinado dos adaptadores $ A em mathbb {r}^{r times k} $ e $ B in mathbb {r}^{d times r} $ .

Por exemplo, considere uma camada em um LLM com uma matriz de peso $ W in mathbb {r}^{1000 times 100} $ . O número de parâmetros para $ W $ é $ 1000 Times 100 = 100.000 $ . Se definirmos a classificação da Lora para $ r = 5 $ , o tamanho dos adaptadores Lora é apenas $ 1000 vezes 5 + 100 vezes 5 = 5.500 $ . Isso significa que o tamanho do adaptador é de cerca de 5% da matriz de peso original $ W $ , o que é significativamente gerenciável para o treinamento como a matriz de peso original $ W $ permanece congelado durante a fase de treinamento.

Neste projeto, variamos o dataset , sequence length e the use of focal loss ; mediu as mudanças de desempenho resultantes em comparação apenas com Lora. O relatório para este projeto: PDF

Este documento fornece instruções detalhadas para replicar nosso projeto de pesquisa. Ele inclui etapas para configurar o ambiente necessário, fazer alterações de código necessárias, executar o modelo em um cluster de computação de alto desempenho (HPC) e apresentar os resultados.

Preparação

1. Instalação de pacotes (Python 3.10 usado)

pip install -r requirements.txt

2. Alteração do código

Para uma compatibilidade com o modelo de depuração, adicione a seguinte função à classe GPTBigCodeConfig no pacote Transformers localizado em your_venv/lib/python3.10/site-packages/transformers/models/gpt_bigcode/configuration_gpt_bigcode.py :

 class GPTBigCodeConfig :
    # ... other methods and attributes ...

    def set_special_params ( self , args ):
        self . args = vars ( args )

Altere o caminho do diretório em ./vul-llm-finetune/LLM/starcoder/run.py

 sys . path . append ( "my_path/vul-llm-finetune/LLM/starcoder" )

Instrução de implementação

1. Solicite a GPU da HPC (com base no servidor OSU HPC)

srun -p dgxh -time = 2-00: 00: 00 -c 2 --gres = gpu: 2 - -mem = 20g --pty Bash

Cluster: DGXH
Tempo: 2-00: 00: 00
#Cpus: 2
#GPUS: 2
Memória: 20g

2. Use o comando abaixo para ser executado (especifique o caminho para economizar e carregar modelo)

Debug usando um pequeno modelo

python vul-llm-finetune/LLM/starcoder/finetune/run.py 
--dataset_tar_gz= ' vul-llm-finetune/Datasets/with_p3/java_k_1_strict_2023_06_30.tar.gz ' 
--split= " train " 
--lora_r 8 
--seq_length 512 
--batch_size 1 
--gradient_accumulation_steps 160 
--learning_rate 1e-4 
--weight_decay 0.05 
--num_warmup_steps 2 
--log_freq=1 
--output_dir= ' vul-llm-finetune/outputs/results_test/ ' 
--delete_whitespaces 
--several_funcs_in_batch 
--debug_on_small_model

Treine usando LLM

python vul-llm-finetune/LLM/starcoder/finetune/run.py 
--dataset_tar_gz= ' vul-llm-finetune/Datasets/with_p3/java_k_1_strict_2023_06_30.tar.gz ' 
--load_quantized_model 
--split= " train " 
--lora_r 8 
--use_focal_loss 
--focal_loss_gamma 1 
--seq_length 512 
--num_train_epochs 15 
--batch_size 1 
--gradient_accumulation_steps 160 
--learning_rate 1e-4 
--weight_decay 0.05 
--num_warmup_steps 2 
--log_freq=1 
--output_dir= ' vul-llm-finetune/outputs/results_0/ ' 
--delete_whitespaces 
--base_model starcoder 
--several_funcs_in_batch

Teste

python vul-llm-finetune/LLM/starcoder/finetune/run.py 
--dataset_tar_gz= ' vul-llm-finetune/Datasets/with_p3/java_k_1_strict_2023_06_30.tar.gz ' 
--load_quantized_model 
--split= " test " 
--run_test_peft 
--lora_r 8 
--seq_length 512 
--checkpoint_dir= ' vul-llm-finetune/outputs/results_0 ' 
--model_checkpoint_path= ' final_checkpoint ' 
--delete_whitespaces 
--base_model starcoder 
--several_funcs_in_batch

Resultado

	Conjunto de dados	Comprimento da sequência	Grande função	Roc auc	Pontuação F1	GPU	Tempo de treinamento (RH)
Qlora	X₁ sem p₃	512	ignorar	0,53	0,65	Tesla T4	8.2
	X₁ sem p₃	512	incluir	0,56	0,66	Nvidia A100 x2	3.4
	X₁ sem p₃	256	ignorar	0,51	0,63	Tesla T4	2.9
	X₁ com p₃	512	ignorar	0,68	0,14	RTX 4080	22.1
	X₁ com p₃	512	incluir	0,72	0,17	Nvidia A100 x2	20.4
	X₁ com p₃	256	ignorar	0,70	0,14	Nvidia A100 x2	18.3
Lora	X₁ sem p₃	2048	incluir	0,69	0,71	Nvidia v100 x8
	X₁ com p₃	2048	incluir	0,86	0,27	Nvidia v100 x8

Conclusão

Neste artigo, recriamos os achados de Shestov et al . em que finalizamos o LLM, WizardCoder, para detecção de vulnerabilidade de código. Enquanto os autores originais usam Lora para fazer isso, empregamos a Qlora para reduzir o tamanho geral do modelo e conseguir treinar esse modelo em uma GPU de nível de consumo. Apesar disso, vemos uma degradação significativa nas métricas de desempenho, embora fique claro que o modelo ainda está aprendendo . Além disso, realizamos experimentação no comprimento da sequência dos hiperparâmetros e incluímos grandes funções . Somos capazes de concluir que a inclusão de grandes funções é um positivo rigoroso para os recursos de aprendizado do modelo, mas a evidência sobre o comprimento da sequência é inconclusiva devido a um experimento desconcertante com resultados muito mais altos que o restante.

Referência

[1] Shestov, A., Levichev, R., Mussabayev, R., Maslov, E., Cheshkov, A., & Zadorozhny, P. (2024). Finetuning Grandes modelos de idiomas para detecção de vulnerabilidades . Arxiv pré -impressão arxiv: 2401.17010. Recuperado em https://arxiv.org/abs/2401.17010.

[2] Hu, Ej, Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., & Chen, W. (2021). Lora: adaptação de baixo rank de grandes modelos de linguagem. ARXIV ARXIV ARXIV: 2106.09685. Recuperado em https://arxiv.org/abs/2106.09685.

[3] Dettmers, T., Pagnoni, A., Holtzman, A. e Zettlemoyer, L. (2023). Qlora: Finetuning eficiente de LLMs quantizados. Arxiv pré -impressão Arxiv: 2305.14314. Recuperado em https://arxiv.org/abs/2305.14314.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-07
tamanho 11.87MB
Vindo de Github

Aplicativos Relacionados

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos