Descargar curlora - Descargar el código fuente curlora

curlora

Otro código fuente

v4.0.0

Descargar

Curlora: Stable LLM Continuo ajuste fino y mitigación de olvido catastrófico

Muhammad Fawi

Código doi:

Preparación de investigación DOI:

Descripción general

Este repositorio contiene el código para el documento de investigación de Curlora, un enfoque novedoso para ajustar los modelos de idiomas grandes (LLM) que aprovecha la descomposición de la matriz Cur en el contexto de la adaptación de bajo rango (LORA). Nuestro método aborda dos desafíos críticos en el ajuste fino de LLM: mitigar el olvido catastrófico durante el aprendizaje continuo y reducir el número de parámetros capacitables. Proponemos una modificación única al proceso de descomposición CUR para permitir una forma más eficiente y estable de adaptar LLM a nuevas tareas sin comprometer ningún conocimiento existente. Demostramos a través de experimentos en múltiples conjuntos de datos que Curlora supera a Lora estándar en la mitigación del olvido catastrófico. Mantiene la estabilidad y el rendimiento del modelo en todas las tareas, al tiempo que reduce significativamente el número de parámetros capacitables. Nuestros resultados muestran que Curlora alcanza los puntajes de precisión y perplejidad superiores en comparación con Lora, particularmente en escenarios con datos limitados.

Contenido

CURLoRA.pdf : el documento de investigación que detalla el enfoque Curlora.
code/ : Directorio que contiene la implementación de Curlora y los experimentos.
- code/curlora.py : que contiene clases Curlora.
- code/utils.py : funciones auxiliares.
- code/lora.py : clases Lora.
- code/curlora_experiment.ipynb : Experimento Curlora con Mistral 7B (ajuste fino en MRPC, SST-2 y Sentiment140).
- code/curlora_experiment-gpt.ipynb : Experimento Curlora con GPT2-Large (ajuste fino en MRPC, SST-2 y Sentiment140).
- code/squad_gpt-curlora.ipynb : ajuste de GPT2-Large para preguntas y respuestas con curlora y sfttrainer en el conjunto de datos de escuadrón.

Los mismos cuadernos están disponibles para Lora.

Comienzo rápido

Primero instalamos los requisitos

pip3 install -r code/requirements.txt

Todas las funciones y clases de Curlora Helper se definen en Code/Curlora.py y Code/Utils.py .

Cargue el modelo y aplique Curlora

 from transformers import AutoTokenizer , AutoModelForCausalLM
from utils import *

model_name = "gpt2-large"
model = AutoModelForCausalLM . from_pretrained ( model_name )
model . to ( "cuda" ) # this will make all existing layers in CUDA

# turning off grad for all layers
for param in model . parameters ():
    param . requires_grad = False


# replace original Q,K,V layers with CURLoRA (GPT2-Large specific)
# refer to utils.py for a more general way
for name , module in model . named_modules ():
    if isinstance ( module , type ( model . transformer . h [ 0 ]. attn )):
        # rank = 24, alpha = 1
        module . c_attn = LinearWithCURLoRA ( module . c_attn , 24 , 1 )


# now look at how many CURLoRA parameters to be trained
total_params = sum ( p . numel () for p in model . parameters () if p . requires_grad )
print ( f"Total trainable parameters after: { total_params :, } " )
# making sure CURLoRA layers are on CUDA as well
model . to ( "cuda" )

Ahora tiene el modelo con las capas Curlora aplicadas a las capas de atención (clave, valor y consulta) que puede usar para ajustar o inferencia normalmente.

Es posible que deba saber cómo se llama a la capa para que pueda reemplazarla correctamente. Por ejemplo, Q, K, V en Mistral se puede encontrar a través de:

 for name , module in model . named_children ():
    if any ( l in name for l in [ "q_proj" , "v_proj" , "k_proj" ]):
        setattr ( model , name , LinearWithCURLoRA ( module , rank , alpha ))

Tenga en cuenta:

Algunas variables y valores están codificados en Code/Utils.py o Code/Curlora.py, como las capas para aplicar, rango, alfa, dispositivo, etc.
Trabajo continuo (las contribuciones son bienvenidas) sobre la cuantización de soporte (Qcurlora), es decir, hasta ahora carga todo el modelo no cuantificado.
En el código/ directorio hay cuadernos para ejecutar los experimentos de papel de investigación
Es posible que deba usar una tasa de aprendizaje ligeramente más alta que con Lora para obtener una mejor precisión. La tasa de aprendizaje más alta no causará un sobreajuste debido a la "regularización implícita" explicada en el documento.

Licencia

Este proyecto tiene licencia bajo la licencia MIT; consulte el archivo de licencia para obtener más detalles.

Citación

Si encuentra útil la investigación o el código de Curlora, considere citarlos.

Cita de código

Bibes

 @software { Fawi_CURLoRA_Leveraging_CUR_2024 ,
  author       = { Fawi, Muhammad } ,
  title        = { {CURLoRA: Leveraging CUR Matrix Decomposition for 
                   Stable LLM Continual Fine-Tuning and Catastrophic
                   Forgetting Mitigation} } ,
  month        = jul,
  year         = 2024 ,
  publisher    = { Zenodo } ,
  version      = { v4.0.0 } ,
  doi          = { 10.5281/zenodo.12729738 } ,
  url          = { https://zenodo.org/doi/10.5281/zenodo.12729738 }
}

APA

 Fawi, M. (2024). CURLoRA: Leveraging CUR Matrix Decomposition for Stable LLM Continual Fine-Tuning and Catastrophic Forgetting Mitigation (v4.0.0) [Computer software]. Zenodo. https://doi.org/10.5281/zenodo.12729738

Cita de trabajo de investigación

Bibes

 @misc { fawi_2024_12730055 ,
  author       = { Fawi, Muhammad } ,
  title        = { {CURLoRA: Leveraging CUR Matrix Decomposition for 
                   Stable LLM Continual Fine-Tuning and Catastrophic
                   Forgetting Mitigation} } ,
  month        = jul,
  year         = 2024 ,
  publisher    = { Zenodo } ,
  doi          = { 10.5281/zenodo.12730055 } ,
  url          = { https://doi.org/10.5281/zenodo.12730055 }
}

APA

 Fawi, M. (2024). CURLoRA: Leveraging CUR Matrix Decomposition for Stable LLM Continual Fine-Tuning and Catastrophic Forgetting Mitigation. Zenodo. https://doi.org/10.5281/zenodo.12730055

La contribución y las ideas serán muy apreciadas

Expandir

Información adicional

Versión v4.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-08
tamaño 213.06KB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo