ดาวน์โหลด ML Bench - ML Bench Source Source Download

ML Bench

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

ML-BENCH: การประเมินแบบจำลองภาษาและตัวแทนขนาดใหญ่สำหรับงานการเรียนรู้ของเครื่องในรหัสระดับที่เก็บ

ข้อความ alt

สารบัญ

- ข้อกำหนดเบื้องต้น
การเตรียมข้อมูล
- ml-llm-bench
- - ข้อกำหนดเบื้องต้น
- - การตั้งค่าสภาพแวดล้อม
- การใช้งาน
- - การโทร API
- - การปรับแต่งแบบโอเพ่นซอร์สแบบปรับแต่ง
  - - ข้อกำหนดเบื้องต้น
  - ? ️ปรับแต่ง
  - - การอนุมาน
- ML-Agent-Bench
- - การตั้งค่าสภาพแวดล้อม
อ้างอิงเรา
ใบอนุญาต

- ข้อกำหนดเบื้องต้น

ในการโคลนที่เก็บนี้ด้วย submodules ทั้งหมดให้ใช้ธง --recurse-submodules :

git clone --recurse-submodules https://github.com/gersteinlab/ML-Bench.git
cd ML-Bench

หากคุณได้โคลนที่เก็บข้อมูลโดยไม่มีธง --recurse-submodules คุณสามารถเรียกใช้คำสั่งต่อไปนี้เพื่อดึงข้อมูลย่อย: submodules:

git submodule update --init --recursive

จากนั้นวิ่ง

pip install -r requirements.txt

การเตรียมข้อมูล

คุณสามารถโหลดชุดข้อมูลโดยใช้รหัสต่อไปนี้:

 from datasets import load_dataset

ml_bench = load_dataset ( "super-dainiu/ml-bench" )    # splits: ['full', 'quarter']

ชุดข้อมูลมีคอลัมน์ต่อไปนี้:

github_id : ID ของที่เก็บ GitHub
github : URL ของที่เก็บ GitHub
repo_id : ID ของตัวอย่างภายในที่เก็บแต่ละตัว
id : ID ที่ไม่ซ้ำกันของตัวอย่างในชุดข้อมูลทั้งหมด
path : เส้นทางไปยังโฟลเดอร์ที่สอดคล้องกันใน LLM-bench
arguments : อาร์กิวเมนต์ที่ระบุในข้อกำหนดของผู้ใช้
instruction : คำแนะนำของผู้ใช้สำหรับงาน
oracle : เนื้อหาของ Oracle ที่เกี่ยวข้องกับงาน
type : ประเภทเอาต์พุตที่คาดหวังตามเนื้อหาของ Oracle
output : เอาต์พุตความจริงภาคพื้นดินที่สร้างขึ้นตามเนื้อหาของ Oracle
prefix_code : รหัสตัวอย่างสำหรับการเตรียมสภาพแวดล้อมการดำเนินการ

หากคุณต้องการเรียกใช้ ML-LLM-BENCH คุณต้องทำการโพสต์ในชุดข้อมูล คุณสามารถใช้รหัสต่อไปนี้เพื่อโพสต์ชุดข้อมูล:

bash scripts/post_process/prepare.sh

ดู Post_process สำหรับรายละเอียดเพิ่มเติม

- ml-llm-bench

- ข้อกำหนดเบื้องต้น

หลังจากโคลน submodules คุณสามารถเรียกใช้

cd scripts/post_process

bash prepare.sh เพื่อสร้างเกณฑ์มาตรฐานเต็มรูปแบบและไตรมาสเป็น merged_full_benchmark.jsonl และ merged_quarter_benchmark.jsonl

คุณสามารถเปลี่ยน readme_content = fr.read() ใน merge.py , บรรทัด 50 เป็น readme_content = fr.read()[:100000] เพื่อให้ได้เนื้อหา readme ความยาว 32k หรือ readme_content = fr.read()[:400000] เพื่อรับเนื้อหาความยาว 128k

ภายใต้การตั้งค่า 128K ผู้ใช้สามารถเตรียมชุดฝึกอบรมและชุดทดสอบใน 10 นาทีกับพนักงาน 10 คน โดยไม่มีข้อ จำกัด โทเค็นผู้ใช้อาจต้องใช้เวลา 2 ชั่วโมงในการเตรียมชุดข้อมูลทั้งหมดและรับชุดข้อมูลขนาดใหญ่

- การตั้งค่าสภาพแวดล้อม

ในการเรียกใช้คอนเทนเนอร์ Docker ML-LLM-Bench คุณสามารถใช้คำสั่งต่อไปนี้:

docker pull public.ecr.aws/i5g0m1f6/ml-bench
docker run -it -v ML_Bench:/deep_data public.ecr.aws/i5g0m1f6/ml-bench /bin/bash

ในการดาวน์โหลดน้ำหนักรุ่นและเตรียมไฟล์คุณสามารถใช้คำสั่งต่อไปนี้:

bash utils/download_model_weight_pics.sh

อาจใช้เวลา 2 ชั่วโมงในการเตรียมพวกเขาโดยอัตโนมัติ

การใช้งาน

วางผลลัพธ์ของคุณใน output/ ไดเรกทอรีและอัปเดต --input_path ใน exec.sh ด้วยเส้นทางของคุณ นอกจากนี้แก้ไขที่อยู่บันทึก

จากนั้นเรียกใช้ bash utils/exec.sh และคุณสามารถตรวจสอบบันทึกการเรียกใช้ในไฟล์บันทึกของคุณดูผลลัพธ์โดยรวมใน output/{{MODEL_NAME}}_{{TASK}}_results_{{TIMESTAMP}}.jsonl และดูผลลัพธ์สำหรับที่เก็บแต่ละแห่ง output/{{MODEL_NAME}}_{{TASK}}_results_{{TIMESTAMP}}.jsonl

ไฟล์ JSONL ทั้งสองที่เริ่มต้นด้วย eval_result และ eval_total มีการดำเนินการบางส่วนในบทความของเรา

output/ โฟลเดอร์รวมถึงเอาต์พุตที่สร้างจากรุ่นที่เราใช้สำหรับการทดสอบ
logs/ โฟลเดอร์บันทึกบันทึกการดำเนินการของเรา
ไฟล์ utils/temp.py ไม่ได้มีไว้สำหรับผู้ใช้ แต่ใช้เพื่อจัดเก็บรหัสที่เขียนโดยรุ่น
นอกจากนี้กระบวนการดำเนินการอาจสร้างไฟล์ที่ไม่จำเป็นใหม่

- การโทร API

ในการทำซ้ำประสิทธิภาพของ OpenAi ในงานนี้ให้ใช้สคริปต์ต่อไปนี้:

bash script/openai/run.sh

คุณต้องเปลี่ยนการตั้งค่าพารามิเตอร์ใน script/openai/run.sh :

type : เลือกจาก quarter หรือ full
model : ชื่อรุ่น
input_file : เส้นทางไฟล์ของชุดข้อมูล
answer_file : คำตอบดั้งเดิมในรูปแบบ JSON จาก GPT
parsing_file : โพสต์กระบวนการเอาต์พุตของ GPT ในรูปแบบ JSONL เพื่อรับกลุ่มรหัสที่ใช้งานได้
readme_type : เลือก oracle_segment และ readme
- oracle_segment : ย่อหน้ารหัสใน readme ที่เกี่ยวข้องกับงานมากที่สุด
- readme : ข้อความทั้งหมดของ readMe ในที่เก็บที่งานอยู่
engine_name : เลือกจาก gpt-35-turbo-16k และ gpt-4-32
n_turn : จำนวนรหัสที่เรียกใช้งานได้ GPT ส่งคืน (5 ครั้งในการทดลองกระดาษ)
openai_key : คีย์ OpenAI API ของคุณ

โปรดดูที่ OpenAI สำหรับรายละเอียด

- การปรับแต่งแบบโอเพ่นซอร์สแบบปรับแต่ง

- ข้อกำหนดเบื้องต้น

Llama-Recipes ให้การกระจาย PIP สำหรับการติดตั้งและการใช้งานที่ง่ายดายในโครงการอื่น ๆ หรือสามารถติดตั้งได้จากแหล่งที่มา

ติดตั้งด้วย PIP

 pip install --extra-index-url https://download.pytorch.org/whl/test/cu118 llama-recipes

ติดตั้งจากแหล่งที่มา เพื่อติดตั้งจากแหล่งที่มาเช่นสำหรับการพัฒนาใช้คำสั่งนี้ เรากำลังใช้การฟักเป็นแบ็กเอนด์ Build ของเราซึ่งต้องใช้ PIP ที่ทันสมัยรวมถึงแพ็คเกจ Setuptools

 git clone https://github.com/facebookresearch/llama-recipes
cd llama-recipes
pip install -U pip setuptools
pip install --extra-index-url https://download.pytorch.org/whl/test/cu118 -e .

? ️ปรับแต่ง

ตามคำนิยามเรามีสามงานในกระดาษ

ภารกิจที่ 1: ให้คำอธิบายงาน + รหัสสร้างตัวอย่างโค้ด
ภารกิจที่ 2: ให้คำอธิบายงาน + การดึงข้อมูลสร้างตัวอย่างโค้ด
ภารกิจที่ 3: ให้คำอธิบายงาน + Oracle สร้างตัวอย่างโค้ด

คุณสามารถใช้สคริปต์ต่อไปนี้เพื่อทำซ้ำประสิทธิภาพการปรับจูนของ Codellama-7b ในงานนี้：

torchrun --nproc_per_node 2 finetuning.py 
    --use_peft 
    --peft_method lora 
    --enable_fsdp 
    --model_name codellama/CodeLlama-7b-Instruct-hf 
    --context_length 8192 
    --dataset mlbench_dataset 
    --output_dir OUTPUT_PATH 
    --task TASK 
    --data_path DATA_PATH

คุณต้องเปลี่ยนการตั้งค่าพารามิเตอร์ของ OUTPUT_PATH TASK และ DATA_PATH ตามลำดับ

OUTPUT_DIR : ไดเรกทอรีเพื่อบันทึกโมเดล
TASK : เลือกจาก 1 , 2 และ 3
DATA_PATH : ไดเรกทอรีของชุดข้อมูล

- การอนุมาน

คุณสามารถใช้สคริปต์ต่อไปนี้เพื่อทำซ้ำประสิทธิภาพการอนุมานของ Codellama-7b ในงานนี้：

python chat_completion.py 
    --model_name ' codellama/CodeLlama-7b-Instruct-hf ' 
    --peft_model PEFT_MODEL 
    --prompt_file PROMPT_FILE 
    --task TASK

คุณต้องเปลี่ยนการตั้งค่าพารามิเตอร์ของ PEFT_MODEL , PROMPT_FILE และ TASK ตามลำดับ

PEFT_MODEL : เส้นทางของโมเดล PEFT
PROMPT_FILE : เส้นทางของไฟล์พรอมต์
TASK : เลือกจาก 1 , 2 และ 3

โปรดดูที่ Finetune สำหรับรายละเอียด

- ML-Agent-Bench

- การตั้งค่าสภาพแวดล้อม

ในการเรียกใช้คอนเทนเนอร์ Docker ML-Agent-Bench คุณสามารถใช้คำสั่งต่อไปนี้:

docker pull public.ecr.aws/i5g0m1f6/ml-bench
docker run -it public.ecr.aws/i5g0m1f6/ml-bench /bin/bash

สิ่งนี้จะดึงอิมเมจนักเทียบท่า ML-agent-bench ล่าสุดและเรียกใช้ในเปลือกแบบโต้ตอบ คอนเทนเนอร์รวมถึงการพึ่งพาที่จำเป็นทั้งหมดเพื่อเรียกใช้รหัสเบส ML-agent-bench

สำหรับ ML-Agent-Bench ใน Opendevin โปรดดูที่คู่มือการตั้งค่า Opendevin

โปรดดูที่ Env สำหรับรายละเอียด