Finetune_LLMs Download - Finetune_LLMs Download de código fonte

Finetune_LLMs

Outro código-fonte

1.0.0

Baixar

Finetune LLMS

Visão geral

Este repositório contém código para ajustar modelos de idiomas grandes (LLMs) com um conjunto de dados de citações famosas.

Os métodos suportados de Finetuning são DeepSpeed, Lora ou Qlora.

Originalmente, o repo baixou e converteu os pesos do modelo para o GPTJ quando ainda não foi adicionado ao pacote de transformadores do HuggingFace. Esse código ainda pode ser visto no ramo original_youtube .

/quotes_dataset contém o conjunto de dados adequadamente formatado para ajuste fino. Veja repo para fazer este conjunto de dados aqui

/finetuning_repo contém código originalmente do repo aqui que modifiquei para trabalhar com mais modelos e com mais métodos.

Assistência profissional

Se precisar de ajuda profissional paga, isso está disponível nesse e -mail

Pastas de vídeo antigas (não use em condições normais)

Veja o vídeo antigo para o código de repo original aqui para um tutorial em vídeo.

Um vídeo mais atualizado para usar o modelo Huggingface pode ser visto aqui

Vá para o ramo original_youtube é que você deseja ver o código, mas eu recomendo que você use métodos mais modernos

Passo a passo atualizado do Docker (use isso em condições normais)

O passo a passo atualizado usa o NVIDIA-Docker para tirar a dor de cabeça de grande parte do processo.

Requisitos

Uma GPU NVIDIA suficiente (normalmente pelo menos 24 GB de VRAM e suporte para FP16). Se estiver usando ofertas em nuvem, recomendo A100. Embora custe mais sua velocidade e VRAM compensem isso.
Use uma máquina Linux. Eu recomendo o Ubuntu
Versão suficientemente moderna do Docker (quando em dúvida atualiza para mais recente)
Nvidia-Docker para permitir a passagem da GPU ao recipiente do docker. Veja o guia de instalação aqui
Verifique se você tem os drivers NVIDIA mais recentes instalados. Confira a ferramenta aqui

Exemplo de drivers CUDA

Se você possui um sistema Linux de 64 bits e precisar de drivers para um A100, poderá executar um comando como esse para ser configurado.

wget https://us.download.nvidia.com/tesla/515.86.01/NVIDIA-Linux-x86_64-515.86.01.run

Você executará o programa baixado com sudo.

chmod 777 NVIDIA-Linux-x86_64-515.86.01.run

sudo ./NVIDIA-Linux-x86_64-515.86.01.run

Uso

Primeiro, construa a imagem do docker executando build_image.sh . Se você receber um erro sobre não poder encontrar a imagem do Docker, atualize para uma versão mais recente do CUDA. As imagens são periodicamente depreciadas. Em seguida, abra um PR para que você possa corrigir esse problema para os outros. Construir a imagem do Docker pode levar muitos minutos.
Run run_image.sh . Este script executa a imagem do Docker que acabou de ser construída e monta o diretório atual para /workspace dentro do recipiente do docker. Todas as GPUs no sistema serão passadas. Além disso, para impedir o download de modelos sempre que este contêiner é executado, seu .cache também será passado.
Esta imagem agora pode ser usada para o Finetuning um modelo com GPUs ou para usar a inferência DeepSpeed. Navegue para outra pasta para obter mais informações

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-04
tamanho 10.81MB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Cachorro_Fox_Coelho

2022-08-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos