Descarga LLM finetune vuln detection - Descargar código fuente LLM finetune vuln detection

LLM finetune vuln detection

Código Fuente de IA

1.0.0

Descargar

Replicación de la investigación: LLM ajuste fino para la detección de vulnerabilidades de código

Autores: Yong-Hwan Lee, James Flora, Shijie Zhao y Yunhan Qiao

Descripción general

Este proyecto replica y se basa en el estudio de Shestov et al. (2024) , con el objetivo de validar y extender sus hallazgos. La investigación original se centró en ajustar los modelos de idiomas grandes (LLM) para la detección de vulnerabilidades de código. El enfoque utilizó LoRA (adaptación de bajo rango), una técnica que implica agregar adaptadores dentro de las capas para ajustar. Durante este proceso, los parámetros del modelo original están congelados , y solo los adaptadores están capacitados, lo que hace que el proceso de capacitación sea más rentable.

Una innovación clave de nuestro trabajo es la incorporación de nuestra adaptación personalizada de QLoRA , que primero cuantifica el LLM a un flotador de 4 bits , reduciendo significativamente su tamaño. Por ejemplo, el modelo 13B-WizardCoder , originalmente alrededor de 26 GB y generalmente requiere más de 30 GB de VRAM, se reduce a aproximadamente 7 GB después de la cuantización. Después de la cuantización, la técnica LoRA se aplica para el ajuste fino.

¿Qué es Lora?

Figura 1 : Ilustración del adaptador de Lora

La Figura 1 ilustra cómo los adaptadores Lora pueden ser significativamente más pequeños que los tamaños de parámetros originales. El número de parámetros para el $ A $ El adaptador es $ r Times k $ , y para el $ B $ adaptador, es $ D Times r $ . Teniendo en cuenta la matriz de parámetros originales es $ d Times k $ , donde ambos $ D $ y $ K $ son generalmente grandes para LLMS, eligiendo un pequeño $ R $ puede reducir efectivamente el número de parámetros. Así, la matriz original $ W in mathbb {r}^{d times k} $ es mucho más grande que el tamaño combinado de los adaptadores $ A in mathbb {r}^{r times k} $ y $ B in mathbb {r}^{d times r} $ .

Por ejemplo, considere una capa en un LLM con una matriz de peso $ W in mathbb {r}^{1000 Times 100} $ . El número de parámetros para $ W $ es $ 1000 veces 100 = 100,000 $ . Si establecemos el rango de Lora en $ r = 5 $ , el tamaño de los adaptadores de Lora es solo $ 1000 veces 5 + 100 veces 5 = 5,500 $ . Esto significa que el tamaño del adaptador es alrededor del 5% de la matriz de peso original $ W $ , que es significativamente manejable para la capacitación como la matriz de peso original $ W $ permanece congelado durante la fase de entrenamiento.

En este proyecto, variamos el dataset , sequence length y the use of focal loss ; midió los cambios de rendimiento resultantes en comparación con Lora solo. El informe para este proyecto: PDF

Este documento proporciona instrucciones detalladas para replicar nuestro proyecto de investigación. Incluye pasos para configurar el entorno necesario, hacer cambios de código requeridos, ejecutar el modelo en un clúster informático de alto rendimiento (HPC) y presentar los resultados.

Preparación

1. Instalación de paquetes (Python 3.10 utilizado)

pip install -r requirements.txt

2. Cambio de código

Para una compatibilidad del modelo de depuración, agregue la siguiente función a la clase GPTBigCodeConfig en el paquete Transformers ubicado en your_venv/lib/python3.10/site-packages/transformers/models/gpt_bigcode/configuration_gpt_bigcode.py :

 class GPTBigCodeConfig :
    # ... other methods and attributes ...

    def set_special_params ( self , args ):
        self . args = vars ( args )

Cambie la ruta del directorio en ./vul-llm-finetune/LLM/starcoder/run.py

 sys . path . append ( "my_path/vul-llm-finetune/LLM/starcoder" )

Instrucción de implementación

1. Solicite GPU de HPC (basado en el servidor OSU HPC)

srun -p dgxh -tiempo = 2-00: 00: 00 -c 2 --grres = gpu: 2 -mem = 20g --pty Bash

Clúster: DGXH
Hora: 2-00: 00: 00
#Cpus: 2
#GPUS: 2
Memoria: 20G

2. Use el siguiente comando a continuación para ejecutar (especifique la ruta para guardar y carga del modelo)

Depurar usando un modelo pequeño

python vul-llm-finetune/LLM/starcoder/finetune/run.py 
--dataset_tar_gz= ' vul-llm-finetune/Datasets/with_p3/java_k_1_strict_2023_06_30.tar.gz ' 
--split= " train " 
--lora_r 8 
--seq_length 512 
--batch_size 1 
--gradient_accumulation_steps 160 
--learning_rate 1e-4 
--weight_decay 0.05 
--num_warmup_steps 2 
--log_freq=1 
--output_dir= ' vul-llm-finetune/outputs/results_test/ ' 
--delete_whitespaces 
--several_funcs_in_batch 
--debug_on_small_model

Entrena usando LLM

python vul-llm-finetune/LLM/starcoder/finetune/run.py 
--dataset_tar_gz= ' vul-llm-finetune/Datasets/with_p3/java_k_1_strict_2023_06_30.tar.gz ' 
--load_quantized_model 
--split= " train " 
--lora_r 8 
--use_focal_loss 
--focal_loss_gamma 1 
--seq_length 512 
--num_train_epochs 15 
--batch_size 1 
--gradient_accumulation_steps 160 
--learning_rate 1e-4 
--weight_decay 0.05 
--num_warmup_steps 2 
--log_freq=1 
--output_dir= ' vul-llm-finetune/outputs/results_0/ ' 
--delete_whitespaces 
--base_model starcoder 
--several_funcs_in_batch

Prueba

python vul-llm-finetune/LLM/starcoder/finetune/run.py 
--dataset_tar_gz= ' vul-llm-finetune/Datasets/with_p3/java_k_1_strict_2023_06_30.tar.gz ' 
--load_quantized_model 
--split= " test " 
--run_test_peft 
--lora_r 8 
--seq_length 512 
--checkpoint_dir= ' vul-llm-finetune/outputs/results_0 ' 
--model_checkpoint_path= ' final_checkpoint ' 
--delete_whitespaces 
--base_model starcoder 
--several_funcs_in_batch

Resultado

	Conjunto de datos	Longitud de secuencia	Gran función	AUC ROC	Puntaje F1	GPU	Tiempo de entrenamiento (RRHH)
Qlora	X₁ sin p₃	512	ignorar	0.53	0.65	Tesla T4	8.2
	X₁ sin p₃	512	incluir	0.56	0.66	Nvidia A100 x2	3.4
	X₁ sin p₃	256	ignorar	0.51	0.63	Tesla T4	2.9
	X₁ con p₃	512	ignorar	0.68	0.14	RTX 4080	22.1
	X₁ con p₃	512	incluir	0.72	0.17	Nvidia A100 x2	20.4
	X₁ con p₃	256	ignorar	0.70	0.14	Nvidia A100 x2	18.3
Lora	X₁ sin p₃	2048	incluir	0.69	0.71	Nvidia v100 x8
	X₁ con p₃	2048	incluir	0.86	0.27	Nvidia v100 x8

Conclusión

En este artículo, recreamos los hallazgos de Shestov et al . en el que finetamos el LLM, WizardCoder, para la detección de vulnerabilidad del código. Si bien los autores originales usan Lora para hacerlo, empleamos Qlora para reducir el tamaño general del modelo y podemos entrenar dicho modelo en una GPU de grado de consumo. A pesar de esto, vemos una degradación significativa en las métricas de rendimiento, aunque está claro que el modelo todavía está haciendo algún tipo de aprendizaje . Además, realizamos la experimentación en la longitud de la secuencia de hiperparámetros e incluimos una gran función . Podemos concluir que incluir funciones grandes es un positivo estricto para las capacidades de aprendizaje del modelo, pero la evidencia sobre la longitud de la secuencia no es concluyente debido a un experimento desconcertante con resultados mucho más altos que el resto.

Referencia

[1] Shestov, A., Levichev, R., Mussabayev, R., Maslov, E., Cheshkov, A. y Zadorozhny, P. (2024). Finecir modelos de lenguaje grande para la detección de vulnerabilidad . Preimpresión ARXIV ARXIV: 2401.17010. Recuperado de https://arxiv.org/abs/2401.17010.

[2] Hu, EJ, Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S. y Chen, W. (2021). Lora: adaptación de bajo rango de modelos de idiomas grandes. Preimpresión ARXIV ARXIV: 2106.09685. Recuperado de https://arxiv.org/abs/2106.09685.

[3] Dettmers, T., Pagnoni, A., Holtzman, A. y Zettlemoyer, L. (2023). Qlora: Fineting eficiente de LLM cuantificados. Prepódico ARXIV ARXIV: 2305.14314. Recuperado de https://arxiv.org/abs/2305.14314.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-07
tamaño 11.87MB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo