Llama 2_Huggingface_4Bit_QLoRA Téléchargement - Llama 2_Huggingface_4Bit

Llama 2_Huggingface_4Bit_QLoRA

Code Source AI

1.0.0

Télécharger

Note de mise à jour

Une version mise à jour peut être trouvée dans un nouveau repo

https://github.com/gmongaras/wizard_qlora_finetuning

Llama-2_huggingface_4bit_qlora

Un exemple de travail d'un modèle Qlora Falcon / Llama2 à 4 bits utilisant HuggingFace

Pour démarrer Finetuning, modifier et exécuter main.py

Une fois la finetuning terminée, vous devez avoir des points de contrôle dans ./outputs . Avant d'exécuter l'inférence, nous pouvons combiner les poids LORA avec les poids d'origine pour une inférence plus rapide et des exigences de GPU plus petites pendant l'inférence. Pour ce faire, exécutez le script merge_weights.py avec vos chemins.

Enfin, vous pouvez exécuter generate.py par exemple génération compte tenu du modèle fusionné.

Exigences

Les exigences Python pour exécuter le script sont situées dans les exigences.txt

Vous devriez ./llama-2 télécharger les poids Falcon du ./tiiuae/falcon-7b https://huggingface.co/meta-llama/Llama-2-7b-hf ici https://huggingface.co/tiiuae/falcon-7b

Plusieurs GPU

Ce script ne prend pas en charge le multi-GPU sur les finetuning 4 bits. Si je trouve un moyen de le faire, je mettrai à jour le script.

Exigences GPU

Le modèle de base prend environ 6 Go de mémoire.
La finetuning dépend de la taille de l'adaptateur, de la taille du lot, de la longueur maximale, etc. Dans la configuration actuelle, l'utilisation de la mémoire est d'environ 8 Go.

Problèmes

S'il y a une erreur de forme lors de la formation, les Bitsandbytes et / ou PEFT ont des problèmes. La meilleure façon de contourner ce problème est de les désinstaller complètement et de les réinstaller de la source:

 python -m pip uninstall bitsandbytes transformers accelerate peft -y
python -m pip install git+https://github.com/huggingface/transformers.git git+https://github.com/huggingface/peft.git git+https://github.com/huggingface/accelerate.git git+https://github.com/timdettmers/bitsandbytes.git -U

Si vous obtenez l'erreur, CUDA Setup failed despite GPU being available. Please run the following command to get more information Veuillez exécuter la commande suivante pour https://github.com/oobabooga/text-generation-webui/issues/147 CUDA Setup failed despite GPU being available. Please run the following command to get more information , puis vous devez construire des bitsandbytes à partir de la source et les mettre dans vos bits et octets.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-07
taille 7.02KB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout