Llama 2_Huggingface_4Bit_QLoRA Download - Llama 2_Huggingface_4Bit

Llama 2_Huggingface_4Bit_QLoRA

Código-Fonte de IA

1.0.0

Baixar

Nota de atualização

Uma versão atualizada pode ser encontrada em um novo repositório

https://github.com/gmongaras/wizard_qlora_finetuning

Llama-2_huggingface_4bit_qlora

Um exemplo de funcionamento de um modelo de 4 bits qlora falcon/llama2 usando huggingface

Para começar a Finetuning, editar e executar main.py

Depois que o Finetuning estiver concluído, você deve ter pontos de verificação em ./outputs . Antes de executar a inferência, podemos combinar os pesos da Lora com os pesos originais para inferência mais rápida e menores requisitos de GPU durante a inferência. Para fazer isso, execute o script merge_weights.py com seus caminhos.

Por fim, você pode executar generate.py , por exemplo, geração, dado o modelo mesclado.

Requisitos

Os requisitos do Python para executar o script estão localizados em requisitos.txt

Você também deve baixar os pesos do Falcon do modelo 7B aqui https://huggingface.co/tiiuae/falcon-7b e colocar os arquivos em um diretório ./tiiuae/falcon-7b ou baixar os pesos llama-2 aqui https://huggingface.co/meta-llama/Llama-2-7b-hf ./llama-2 2

GPUs múltiplas

Este script não suporta multi-GPUs no Finetuning de 4 bits. Se eu encontrar uma maneira de fazer isso, atualizarei o script.

Requisitos de GPU

O modelo básico leva cerca de 6 GB de memória.
O Finetuning depende do tamanho do adaptador, tamanho do lote, comprimento máximo, etc. Na configuração atual, o uso da memória é de cerca de 8 GB.

Problemas

Se houver um erro de forma ao treinar, Bitsandbytes e/ou PEFT estão tendo problemas. A melhor maneira de contornar esse problema é desinstalá -los completamente e reinstalá -los da fonte:

 python -m pip uninstall bitsandbytes transformers accelerate peft -y
python -m pip install git+https://github.com/huggingface/transformers.git git+https://github.com/huggingface/peft.git git+https://github.com/huggingface/accelerate.git git+https://github.com/timdettmers/bitsandbytes.git -U

Se você receber o erro CUDA Setup failed despite GPU being available. Please run the following command to get more information , então você precisa construir bitsandbytes a partir da fonte e colocá-lo em seus bits e bytes site-package seguindo https://github.com/oobabooga/text-generation-webui/issues/147

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-07
tamanho 7.02KB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos