Descarga gpt light - Descargar el código fuente gpt light

gpt light

Código Fuente de IA

1.0.0

Descargar

GPT-Light

TLDR

El objetivo de este repositorio es proporcionar una implementación simple de los modelos GPT que se pueden utilizar para aplicaciones de producción. El código actualmente admite los siguientes casos de uso:

Entrenando una arquitectura GPT desde cero.
Ajunte de un modelo GPT existente (por ejemplo, los modelos GPT2 de código abierto) en nuevos datos.
Uso de un modelo GPT entrenado para hacer predicciones por lotes.
Implementar un modelo GPT capacitado como API REST para servir.

Siéntase libre de desembolsar este repositorio y usarlo como plantilla para desarrollar sus propias aplicaciones GPT.

Trabajo futuro

Queremos que eventualmente incluya el ajuste de chatgpt con sede en RL. En general, esto no cambia el modelo de conocimiento subyacente, pero hace que la interacción con el modelo sea más humano.

Configuración

Configurar el código es bastante mínimo y puede reproducirse fácilmente en entornos de VM locales o de nubes.*

Instale Pytorch (con soporte de GPU opcional)
Crear entorno de conda:

 conda create -n python38 python=3.8
conda activate python38

Instalar dependencias:

 conda install --file requirements.txt

* En el futuro intentaremos proporcionar una versión Docker de esta configuración.

Corriendo cosas

Preparación de datos Tiny-Shakespeare

Proporcionamos un código de muestra que descarga y preprocesos el conjunto de datos Tiny-Shakespeare para capacitación y ajuste fino. Use este código como plantilla para crear preprocesamiento de datos para sus propios datos.

 python src/data_io/fetch_shakespeare.py

Entrenamiento Tiny-Shakespeare

Entrenamiento de un modelo GPT muy pequeño desde cero en el conjunto de datos Tiny-Shakespeare creado en el paso anterior. El modelo resultante no será muy generalizable, ya que es bastante pequeño y entrenado en un conjunto de datos muy pequeño, pero puede generar citas similares a Shakespeare.

Cambie el archivo de configuración y para entrenar un modelo desde cero en sus propios datos. En este punto, técnicamente puede escalar a tamaños de modelo muy grandes de acuerdo con el tamaño y los recursos de sus datos.*

 python src/training/train_main.py --config_file config/train_shakespeare_small.yml

* Para este paso, probablemente necesitará una o varias GPU.

GPT2 ajustado en Shakespeare

Ajunte el modelo GPT2 de código abierto en sus propios datos. Es posible utilizar cualquier modelo de código abierto GPT (GPT2-Medio, GPT2-XL, etc.). Esta es la opción más común, ya que requiere menos datos y recursos (es posible ejecutar esto incluso en una CPU) y es mucho más rápido que el entrenamiento desde cero.

 python src/training/train_main.py --config_file config/finetune_shakespeare.yml

Muestreo del modelo Shakespeare

Muestra una serie de salidas de un modelo capacitado dado un mensaje de entrada. Esto se puede usar para la inferencia por lotes.

 python src/inference/sample_main.py --config_file config/sample_shakespeare.yml

Inicio del servidor

Un servidor Lightweigth que sirve a un modelo capacitado en una API REST.

 uvicorn src.inference.service_main:app --reload --reload-include config/sample_gpt2.yml

Una vez que el servidor se ejecuta, puede consultar el punto final con un mensaje (como solicitud de publicación). Para obtener más detalles sobre los detalles de la consulta, eche un vistazo al siguiente script de prueba.

Punto final de prueba

Una vez que su servidor se está ejecutando, puede probar el punto final utilizando el siguiente script.

 python src/inference/test_query.py

Pruebas

Este repositorio se ha implementado teniendo en cuenta una aplicación de producción e incluye pruebas de unidad y integración.

* Tesing no es un cajero automático extenso, pero intentaremos aumentar la cobertura en el futuro.

Ejecutar pruebas unitarias

Se han incluido pruebas unitarias para cubrir la funcionalidad principal. Puede ejecutar la suite de prueba unitaria completa con el siguiente comando:

 pytest test/unit/

Ejecutar pruebas de integración

Además de las pruebas unitarias, hemos incluido algunas pruebas de integración para los flujos de trabajo de entrenamiento, ajuste y muestreo.

 pytest test/integration/

* Las pruebas de integración actualmente requieren datos para funcionar (ver arriba).

Configuración previa al contrato

Generalmente es aconsejable habilitar ganchos previos al compromiso cuando se trabaja con el repositorio. Actualmente ejecuta algunas verificaciones de formato básicas y ejecuta el conjunto de pruebas unitarias (pero no las pruebas de integración).

 conda install -c conda-forge pre-commit
pre-commit install

expresiones de gratitud

La implementación de GPT en este repositorio está inspirada en el repositorio de nanogpt de Andrej Karpathy. Nuestro objetivo era volver a implementarlo, volver a estructurarlo y extenderlo con módulos que faciliten la construcción de diferentes tipos de aplicaciones de producción además de ella.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-10
tamaño 468.07KB
Proviene de Github

Aplicaciones relacionadas

La última versión de GPT cine y televisión.

2023-10-30
Software ligero y ligero

2023-07-11
Aplicación BWEE Light

2023-06-17
Laberinto de luz versión china

2023-05-15
Vagabundo hiperligero

2022-08-08
Última luz

2022-07-30

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo