Llama 2_Huggingface_4Bit_QLoRA Descargar - Llama 2_Huggingface_4Bit

Llama 2_Huggingface_4Bit_QLoRA

Código Fuente de IA

1.0.0

Descargar

Nota de actualización

Se puede encontrar una versión actualizada en un nuevo repositorio

https://github.com/gmongaras/wizard_qlora_finetuning

Llama-2_huggingface_4bit_qlora

Un ejemplo de trabajo de un modelo de 4 bits Qlora Falcon/Llama2 usando Huggingface

Para comenzar la sintonización, editar y ejecutar main.py

Una vez que se complete la Finetuning, debe tener puntos de control ./outputs . Antes de ejecutar inferencia, podemos combinar los pesos de Lora con los pesos originales para una inferencia más rápida y requisitos de GPU más pequeños durante la inferencia. Para hacer esto, ejecute el script merge_weights.py con sus rutas.

Finalmente, puede ejecutar generate.py , por ejemplo, generación dado el modelo fusionado.

Requisitos

Los requisitos de Python para ejecutar el script se encuentran en requisitos.

También debe descargar los pesos de Falcon del modelo 7B aquí https://huggingface.co/tiiuae/falcon-7b y poner los archivos en un directorio ./tiiuae/falcon-7b o descargar las pesas LLAMA-2 aquí https://huggingface.co/meta-llama/Llama-2-7b-hf y ponerlos en un directorio aquí ./llama-2

GPU múltiples

Este script no admite multi-GPU en Finetuning de 4 bits. Si encuentro una manera de hacer esto, actualizaré el script.

Requisitos de GPU

El modelo base toma aproximadamente 6 GB de memoria.
La fina depende del tamaño del adaptador, el tamaño del lote, la longitud máxima, etc. En la configuración actual, el uso de la memoria es de aproximadamente 8 GB.

Asuntos

Si hay un error de forma al entrenamiento, entonces Bitsandbytes y/o Peft están teniendo problemas. La mejor manera de solucionar este problema es desinstalarlos por completo y reinstalarlos de la fuente:

 python -m pip uninstall bitsandbytes transformers accelerate peft -y
python -m pip install git+https://github.com/huggingface/transformers.git git+https://github.com/huggingface/peft.git git+https://github.com/huggingface/accelerate.git git+https://github.com/timdettmers/bitsandbytes.git -U

Si recibe el error CUDA Setup failed despite GPU being available. Please run the following command to get more information , luego debe construir bitsandbytes desde la fuente y ponerla en su paquete de sitio bits y bytes siguiendo https://github.com/oobabooga/text-generation-webui/issues/147

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-07
tamaño 7.02KB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo