Descargar Finetune_LLMs - Descargar el código fuente Finetune

Finetune_LLMs

Otro código fuente

1.0.0

Descargar

Finetune LLMS

Descripción general

Este repositorio contiene código para ajustar los modelos de lenguaje grande (LLMS) con un conjunto de datos de citas famosas.

Los métodos compatibles de Finetuning son Deepspeed, Lora o Qlora.

Originalmente, el repositorio descargó y convirtió los pesos del modelo para GPTJ cuando aún no se agregó al paquete Huggingface Transformer. Ese código aún se puede ver en la rama original_youtube .

/quotes_dataset contiene el conjunto de datos correctamente formateado para ajustar. Vea el repositorio para hacer este conjunto de datos aquí

/finetuning_repo contiene código originalmente del repositorio aquí que he modificado para trabajar con más modelos y con más métodos.

Asistencia profesional

Si necesita ayuda profesional pagada, eso está disponible a través de este correo electrónico

Tutoros de video antiguos (no use en condiciones normales)

Vea el video antiguo del código de repositorio original aquí para un video tutorial.

Se puede ver un video más actualizado para usar el modelo Huggingface

Vaya a la sucursal original_youtube , ¿desea ver el código, pero le recomiendo que use métodos más modernos?

Tutorial actualizado de Docker (use esto en condiciones normales)

El tutorial actualizado utiliza Nvidia-Docker para sacar el dolor de cabeza de gran parte del proceso.

Requisitos

Una GPU NVIDIA suficiente (típicamente al menos 24 GB de VRAM y soporte para FP16). Si uso ofertas de nubes, recomiendo A100. Aunque cuesta más su velocidad y su compensación de VRAM.
Use una máquina Linux. Recomiendo ubuntu
La versión suficientemente moderna de Docker (cuando tiene dudas, se actualice a las últimas)
Nvidia-Docker para permitir el paso de GPU al contenedor Docker. Vea la guía de instalación aquí
Asegúrese de tener los últimos controladores NVIDIA instalados. Mira la herramienta aquí

Ejemplo de conductores de cuda

Si tiene un sistema Linux de 64 bits y necesita controladores para un A100, puede ejecutar un comando como este para configurar.

wget https://us.download.nvidia.com/tesla/515.86.01/NVIDIA-Linux-x86_64-515.86.01.run

Luego ejecutará el programa descargado con sudo.

chmod 777 NVIDIA-Linux-x86_64-515.86.01.run

sudo ./NVIDIA-Linux-x86_64-515.86.01.run

Uso

Primero, cree la imagen Docker ejecutando build_image.sh . Si recibe un error al no poder encontrar la imagen Docker, actualice una nueva versión CUDA. Las imágenes están periódicamente en desuso. Luego abra un PR para que pueda solucionar este problema para los demás. Construir la imagen Docker puede llevar muchos minutos.
Run run_image.sh . Este script ejecuta la imagen Docker que se acaba de construir y monta el directorio actual a /workspace dentro del contenedor Docker. Se pasarán todas las GPU en el sistema. Además, para evitar la descarga de modelos cada vez que se ejecute este contenedor, su .cache también se pasará.
Esta imagen ahora se puede usar para finular un modelo con GPU o para usar la inferencia de la velocidad profunda. Navegue a otra carpeta para más información

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-04
tamaño 10.81MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
perro_zorro_conejito

2022-08-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo