GPT from Scratch with Tensorflow descargar - GPT from Scratch with Tensorflow descargar

GPT from Scratch with Tensorflow

Código Fuente de IA

1.0.0

Descargar

Genesismind-building-GPT-desde-scratch

GPT "Transformador generativo previamente capacitado" es la primera versión de la serie de modelos GPT, el procesamiento de lenguaje natural revolucionado con sus capacidades de modelado de lenguaje autorregresivo basadas en la arquitectura del transformador.

Descripción general

Este proyecto es una implementación del modelo GPT (transformador generativo previamente entrenado) desde cero usando TensorFlow. Incluye todos los componentes del modelo, como los incrustaciones posicionales, el mecanismo de atención, las capas de alimentación y más.

Nota importante: El objetivo de este proyecto es proporcionar una comprensión profunda de la arquitectura GPT y sus funcionamientos internos. Entonces, es principalmente para fines educativos. Puede comprender completamente la estructura y el mecanismo de trabajo de este modelo aquí, y usar los componentes que he implementado en sus proyectos. En general, si desea utilizar el proyecto para capacitar a su modelo de idioma con Big Data, es posible que deba modificar el archivo del conjunto de datos para poder procesar Big Data de manera más eficiente. Diseñé el archivo del conjunto de datos principalmente para manejar datos simples, no grandes, porque ahora no estoy a este respecto.

Hay varias versiones del GPT. Esta implementación se centra principalmente en la implementación de "Mejora de la comprensión del lenguaje mediante la pretruación generativa".

Estructura de proyectos

config.py : archivo de configuración para hiperparámetros del modelo.
decoder.py : GPT Decoder.
positional_embeddings.py : generación de incrustación posicional.
embeddings.py : generación de insertos de token.
attention.py : mecanismo de autoeficiencia.
feed_forward.py : red neuronal de feed-forward.
lr_schedule.py : programación de tasas de aprendizaje.
utils.py : funciones de utilidad para capacitación e inferencia.
loss_functions.py : funciones de pérdida personalizada.
metrics.py : Métricas de evaluación personalizada.
streamer.py : Streamer de datos para capacitación eficiente.
gpt_model.py : implementación principal del modelo GPT.
bpe_tokenizer.py : Tokenizer para Tokenización BPE (Byte Par Coding).
tokenizer.py : Tokenizer GPT previamente capacitado.
prepare_dataset.py : un archivo a través del cual realizamos algunas operaciones en el conjunto de datos (creando una carpeta especial para datos de validación).
inferance.py : un archivo necesario para generar oraciones del modelo basado en el mensaje de entrada.
tmp/ : Directorio para almacenar puntos de control modelo.
demo/ : documentación del proyecto.
tokenizer/ : Directorio para guardar el tokenizador de entrenamiento.
dummy_data/ : Directorio en el que colocamos algunos datos para probar el transmisor.

Requisitos

Python 3.10.6
TensorFlow 2.12.0
Transformers 4.33.2 (solo para tokenizer)

Documentación

La documentación detallada del proyecto se puede encontrar en la demo/ directorio. Incluye explicaciones de la arquitectura GPT, los procedimientos de capacitación y cómo usar el modelo para varias tareas de procesamiento del lenguaje natural.

Uso

Clon el repositorio:

git clone https://github.com/AliHaiderAhmad001/GPT-from-Scratch-with-Tensorflow.git
cd GPT-from-Scratch-with-Tensorflow

Crear un entorno virtual (opcional pero recomendado):

python -m venv venv
source venv/bin/activate  # On Windows: venvScriptsactivate

Instalar dependencias del proyecto:
```
pip install -r requirements.txt
```
Descargue y prepare el conjunto de datos: puede ir y revisar la demostración. Puede trabajar en el mismo conjunto de datos, cambiarlo o ajustar sus preferencias. Sin embargo, puede descargar el conjunto de datos directamente desde aquí. Puede tomar una parte para la validación a través del siguiente código:
```
python prepare_dataset.py aclImdb/test aclImdb/valid --num_files_to_move 2500
```

El cargador de datos que uso requiere que el conjunto de validación esté en una carpeta separada.

Opcionalmente, puede volver a entrenar GPT Tokinizer:

python bpe_tokenizer.py aclImdb --batch_size 1000 --vocab_size 50357 --save --save_fp tokenizer/adapted-tokenizer

Capacite al modelo GPT (proporcione instrucciones más específicas si es necesario):
- Para comenzar a entrenar desde cero: python train.py
- Para reanudar la capacitación desde un punto de control: python train.py --resume

Generar oraciones. Puede usar el siguiente comando para generar texto usando su script:

python inferance.py " input_text_prompt " --sampler " greedy "  # For greedy sampling

O:

python inferance.py " input_text_prompt " --sampler " beam " --beam_width 5  # For beam search sampling with a beam width of 5

Licencia

Este proyecto tiene licencia bajo la licencia MIT. Consulte el archivo de licencia para obtener más detalles.

Expresiones de gratitud

Openai Gpt.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-10
tamaño 1.17MB
Proviene de Github

Aplicaciones relacionadas

Ir

2022-08-20
Escapar de Tarko

2022-08-09
Un beso de la muerte

2022-08-01
escapar de la ciudad del terror

2022-07-31
escapar de la escuela

2022-07-29
Escapar de la isla de los monos

2022-07-24

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo