llama2 lora fine tuning Descargar - llama2 lora fine tuning Code Descargar Descargar

llama2 lora fine tuning

Código Fuente de IA

1.0.0

Descargar

Fino Tune Llama2-Chat con Lora y Deepsed

Tune fino el modelo LLAMA-2-7B-CHAT en dos P100 (16 g).

La fuente de datos adopta el formato Alpaca y consta de dos fuentes de datos: trenes y validación.

1. Requisitos de tarjeta gráfica

16 g de memoria de video y arriba (P100 o T4 y superior), uno o más bloques.

2. Código fuente de clones

git clone https://github.com/git-cloner/llama2-lora-fine-tuning
cd llama2-lora-fine-tuning

3. Entorno dependiente de la instalación

 # 创建虚拟环境
conda create -n llama2 python=3.9 -y
conda activate llama2
# 下载github.com上的依赖资源（需要反复试才能成功，所以单独安装）
export GIT_TRACE=1
export GIT_CURL_VERBOSE=1
pip install git+https://github.com/PanQiWei/AutoGPTQ.git -i https://pypi.mirrors.ustc.edu.cn/simple --trusted-host=pypi.mirrors.ustc.edu.cn
pip install git+https://github.com/huggingface/peft -i https://pypi.mirrors.ustc.edu.cn/simple
pip install git+https://github.com/huggingface/transformers -i https://pypi.mirrors.ustc.edu.cn/simple
# 安装其他依赖包
pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple
# 验证bitsandbytes
python -m bitsandbytes

4. Descargue el modelo original

python model_download.py --repo_id daryl149/llama-2-7b-chat-hf

5. Expanda la lista de palabras chinas

 # 使用了https://github.com/ymcui/Chinese-LLaMA-Alpaca.git的方法扩充中文词表
# 扩充完的词表在merged_tokenizes_sp（全精度）和merged_tokenizer_hf（半精度）
# 在微调时，将使用--tokenizer_name ./merged_tokenizer_hf参数
python merge_tokenizers.py 
  --llama_tokenizer_dir ./models/daryl149/llama-2-7b-chat-hf 
  --chinese_sp_model_file ./chinese_sp.model

6. Descripción del parámetro ajustado

Hay varios parámetros que se pueden ajustar:

parámetro	ilustrar	Obtener el valor
load_in_bits	Precisión del modelo	4 y 8. Si la memoria de video no se desborda, intente elegir la alta precisión 8.
BLOCK_SIZE	Longitud máxima del token	Primera opción 2048, desbordamiento de memoria, 1024, 512, etc.
per_device_train_batch_size	Número de lotes por tarjeta cargados en cada vez durante el entrenamiento	Mientras la memoria no se desborda, intente ir a las elecciones generales
per_device_eval_batch_size	Número de lotes por tarjeta cargados en cada momento durante la evaluación	Mientras la memoria no se desborda, intente ir a las elecciones generales
incluir	Secuencias de tarjetas gráficas utilizadas	Por ejemplo, dos piezas: Localhost: 1,2 (tenga en cuenta que la secuencia no es necesariamente la misma que lo que ve NVIDIA-SMI)
num_train_epochs	Número de rondas de entrenamiento	Al menos 3 rondas

7. Ajuste fino

chmod +x finetune-lora.sh
# 微调
./finetune-lora.sh
# 微调（后台运行）
pkill -9 -f finetune-lora
nohup ./finetune-lora.sh > train.log  2>&1 &
tail -f train.log

8. Prueba

CUDA_VISIBLE_DEVICES=0 python generate.py 
    --base_model ' ./models/daryl149/llama-2-7b-chat-hf ' 
    --lora_weights ' output/checkpoint-2000 ' 
    --load_8bit #不加这个参数是用的4bit

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-02
tamaño 20.48MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo