Descargar FTUP - Descargar código fuente FTUP

FTUP

Código Fuente de IA

1.0.0

Descargar

FT-UP: Script de carga de Finetuning de OpenAi

Este script ayuda a automatizar el proceso de preparación de datos para Finetuning en modelos Operai, específicamente GPT-3.5 y Babbage. También proporciona utilidades para validar los datos, transformar los datos en el formato JSONL requerido y estimar el costo del proceso de fineciring.

Características:

Validar la tecla API
Validar y seleccionar el modelo apropiado (GPT-3.5 o Babbage)
Verifique el archivo de datos de entrada (JSONL)
Estimarse de costo de sintonización
Crear y administrar trabajos de Finetuning en OpenAI

Requisitos:

Python 3
Bibliotecas externas: pyfiglet , openai , tiktoken , dotenv , argparse , json , re , os , sys , time , clint

Para instalar las bibliotecas requeridas:

pip install pyfiglet openai tiktoken python-dotenv argparse clint

o

pip install requirements.txt

Uso:

 python ftup.py [-k <API_KEY>] -m <MODEL_NAME> -f <INPUT_FILE> [-s <SUFFIX>] [-e <EPOCHS>]

Argumentos:

-k, --key : opcional. Clave API. Argumento opcional, pero requerido en el envéano predeterminado para tener una clave API en Enviroment. OPERAI_API_KEY
-m, --model : requerido. Modelo para usar. Opciones: gpt para gpt-3.5-turbo-0613 o bab para babbage-002 .
-f, --file : requerido. Archivo de datos de entrada (formato JSONL).
-s, --suffix : Opcional. Agregue un sufijo para su modelo Finetuned. Por ejemplo, 'my-suffix-title-v-1'.
-e, --epoch : opcional. Número de épocas para el entrenamiento. El valor predeterminado es 3.

Variables de entorno (opcional):

Almacene su clave API en un archivo .env en el formato:

 OPENAI_API_KEY=your_api_key_here

El script se cargará de forma predeterminada esta clave si no -k / --key pasa como argumento.

Funciones:

check_key(key) : valida el formato para la tecla API de OpenAI.
check_model(model) : valida el nombre del modelo.
check_jsonl_file(file) : verifica si el archivo proporcionado tiene un nombre JSONL válido y si existe.
create_update_jsonl_file(model, file) : verifique si JSONL tiene un formato correcto y carga el archivo a OpenAI.
update_ft_job(file_id_name, model, suffix, epoch) : crea o actualiza el trabajo de Finetuning en OpenAI.
check_jsonl_gpt35(file) : valida el formato para la capacitación GPT-3.5.
check_jsonl_babbage(file) : valida el formato para el entrenamiento Babbage-002.
cost_gpt(file, epochs) : estima el costo del proceso de finecing.

Notas:

Asegúrese de que sus datos se adhieran a las directrices de formato de datos de OpenAI para Finetuning.
Monitoree su tablero de OpenAI para realizar un seguimiento de su uso y costos.

Referencias:

Documentación de OpenAI
Libro de cocina de Operai - Finetuning
Biblioteca de Python Argparse
documentación de Pyfiglet
Biblioteca Tiktoken

Siguientes características:

Cancelar la tecla Presionadora de capacitación
Agregar token y costo para el modelo de babbage
Automatizar para crear archivos de tren y validación 80-20%

Ejemplo de salida terminal:

 $ python ftup.py --key your_api_key_here --file train_gpt3_5.jsonl --model gpt --epoch 1 --suffix custom-model-name
or
$ python ftup.py -f train_gpt3_5.jsonl -m gpt -e 1 -s custom-model-name
    ____________            __  ______ 
   / ____/_  __/           / / / / __ 
  / /_    / /    ______   / / / / /_/ /
 / __/   / /    /_____/  / /_/ / ____/ 
/_/     /_/              ____/_/  


Checking API key ...
- API Key

Checking model ...
- Model gpt

Checking if jsonl is valid ...
- JSON File train_gpt3_5.jsonl

Checking if jsonl format is valid for GPT-3.5 training ...
- Num examples: 225
- JSONL train_gpt3_5.jsonl correct format

Uploading jsonl train file ...
- File ID: file-abcd123

Dataset has ~15153 tokens that will be charged for during training
You'll train for 1 epochs on this dataset
By default, you'll be charged for ~15153 tokens
Total cost: $0.1212 ?

Creating a finetuning job ...
- Fintetuning job id: ftjob-abc123

Status: succeeded
Finetuning succeeded! ☑️
Finetune model: ft:gpt-3.5-turbo:openai:custom-model-name:7p4lURe

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-29
tamaño 7.55KB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo