FTUP 다운로드 FTUP 소스 코드 다운로드

FTUP

AI 소스 코드

1.0.0

다운로드

FT-UP : OpenAi Finetuning 업로드 스크립트

이 스크립트는 OpenAI 모델, 특히 GPT-3.5 및 Babbage에서 미세 조정을위한 데이터를 준비하는 프로세스를 자동화하는 데 도움이됩니다. 또한 데이터를 검증하고 데이터를 필요한 JSONL 형식으로 변환하고 Finetuning 프로세스의 비용을 추정하는 유틸리티를 제공합니다.

특징:

API 키를 확인하십시오
적절한 모델을 확인하고 선택하십시오 (GPT-3.5 또는 Babbage)
입력 데이터 파일 (JSONL) 확인
미세 조정 비용을 추정하십시오
OpenAI에서 미세 조정 작업을 만들고 관리합니다

요구 사항 :

파이썬 3
외부 라이브러리 : pyfiglet , openai , tiktoken , dotenv , argparse , json , re , os , sys , time , clint

필요한 라이브러리를 설치하려면 :

pip install pyfiglet openai tiktoken python-dotenv argparse clint

또는

pip install requirements.txt

용법:

 python ftup.py [-k <API_KEY>] -m <MODEL_NAME> -f <INPUT_FILE> [-s <SUFFIX>] [-e <EPOCHS>]

논쟁 :

-k, --key : 선택 사항. API 키. 선택적 인수, 그러나 기본 ENV에서는 Enviroment에 API 키를 갖기 위해 필요합니다. Openai_api_key
-m, --model : 필수. 사용할 모델. 옵션 : gpt-3.5-turbo-0613 용 gpt 또는 babbage-002 용 bab .
-f, --file : 필수. 입력 데이터 파일 (JSONL 형식).
-s, --suffix : 선택 사항. Finetuned 모델에 접미사를 추가하십시오. 예를 들어, 'My-Suffix-Title-V-1'.
-e, --epoch : 선택 사항. 훈련을위한 에포크 수. 기본값은 3입니다.

환경 변수 (선택 사항) :

API 키를 .env 파일에 형식으로 저장하십시오.

 OPENAI_API_KEY=your_api_key_here

스크립트는 기본적으로 -k / --key 아닌 경우이 키를 기본적으로로드합니다.

기능 :

check_key(key) : OpenAI API 키 형식을 확인합니다.
check_model(model) : 모델 이름을 확인합니다.
check_jsonl_file(file) : 제공된 파일에 유효한 JSONL 이름이 있는지 확인하고 존재하는지 확인합니다.
create_update_jsonl_file(model, file) : JSONL에 올바른 형식이 있는지 확인하고 파일을 OpenAi에 업로드하는지 확인하십시오.
update_ft_job(file_id_name, model, suffix, epoch) : OpenAi에서 FinetUning 작업을 작성하거나 업데이트합니다.
check_jsonl_gpt35(file) : GPT-3.5 교육 형식을 확인합니다.
check_jsonl_babbage(file) : Babbage-002 교육 형식을 확인합니다.
cost_gpt(file, epochs) : 미세 조정 프로세스의 비용을 추정합니다.

참고 :

데이터가 Finetuning을위한 OpenAI의 데이터 형식 지침을 준수해야합니다.
OpenAi 대시 보드를 모니터링하여 사용 및 비용을 추적하십시오.

참조 :

Openai 문서
Openai Cookbook- FINETUNING
Python Argparse 라이브러리
pyfiglet 문서
Tiktoken 도서관

다음 기능 :

교육 프레스 키를 취소하십시오
Babbage 모델의 토큰 및 비용 추가
열차 및 검증 파일 생성을위한 자동 80-20%

터미널 출력 예 :

 $ python ftup.py --key your_api_key_here --file train_gpt3_5.jsonl --model gpt --epoch 1 --suffix custom-model-name
or
$ python ftup.py -f train_gpt3_5.jsonl -m gpt -e 1 -s custom-model-name
    ____________            __  ______ 
   / ____/_  __/           / / / / __ 
  / /_    / /    ______   / / / / /_/ /
 / __/   / /    /_____/  / /_/ / ____/ 
/_/     /_/              ____/_/  


Checking API key ...
- API Key

Checking model ...
- Model gpt

Checking if jsonl is valid ...
- JSON File train_gpt3_5.jsonl

Checking if jsonl format is valid for GPT-3.5 training ...
- Num examples: 225
- JSONL train_gpt3_5.jsonl correct format

Uploading jsonl train file ...
- File ID: file-abcd123

Dataset has ~15153 tokens that will be charged for during training
You'll train for 1 epochs on this dataset
By default, you'll be charged for ~15153 tokens
Total cost: $0.1212 ?

Creating a finetuning job ...
- Fintetuning job id: ftjob-abc123

Status: succeeded
Finetuning succeeded! ☑️
Finetune model: ft:gpt-3.5-turbo:openai:custom-model-name:7p4lURe

확장하다

추가 정보