GPT from Scratch with Tensorflow - GPT from Scratch with Tensorflow

GPT from Scratch with Tensorflow

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Genesismind-building-gpt-from-scratch

GPT "Transformer ที่ผ่านการฝึกอบรมมาแล้ว" เป็นรุ่นแรกของชุดรุ่น GPT ของแบบจำลองการปฏิวัติการประมวลผลภาษาธรรมชาติด้วยความสามารถในการสร้างแบบจำลองภาษาอัตโนมัติที่สร้างขึ้นบนสถาปัตยกรรมหม้อแปลง

ภาพรวม

โครงการนี้เป็นการดำเนินการตามรุ่น GPT (Transformer ที่ผ่านการฝึกอบรมมาแล้วก่อนหน้านี้ตั้งแต่เริ่มต้นโดยใช้ TensorFlow มันรวมถึงส่วนประกอบทั้งหมดของแบบจำลองเช่นการฝังตำแหน่งกลไกความสนใจเลเยอร์ฟีดไปข้างหน้าและอื่น ๆ

หมายเหตุสำคัญ: เป้าหมายของโครงการนี้คือการให้ความเข้าใจอย่างลึกซึ้งเกี่ยวกับสถาปัตยกรรม GPT และการทำงานภายใน ดังนั้นจึงเป็นหลักเพื่อจุดประสงค์ด้านการศึกษา คุณสามารถเข้าใจโครงสร้างและกลไกการทำงานของโมเดลนี้ได้ที่นี่และใช้ส่วนประกอบที่ฉันได้นำไปใช้ในโครงการของคุณ โดยทั่วไปหากคุณต้องการใช้โครงการเพื่อฝึกอบรมรูปแบบภาษาของคุณด้วยข้อมูลขนาดใหญ่คุณอาจต้องแก้ไขไฟล์ชุดข้อมูลเพื่อให้สามารถประมวลผลข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพมากขึ้น ฉันออกแบบไฟล์ชุดข้อมูลเป็นหลักเพื่อจัดการข้อมูลที่ง่ายไม่ใหญ่เพราะฉันไม่ได้อยู่ในเรื่องนี้ในตอนนี้

GPT มีหลายรุ่น การใช้งานนี้มุ่งเน้นไปที่การดำเนินการของ "การปรับปรุงความเข้าใจภาษาโดยการฝึกอบรมก่อนการกำเนิด"

โครงสร้างโครงการ

config.py : ไฟล์กำหนดค่าสำหรับโมเดลไฮเปอร์พารามิเตอร์
decoder.py : ตัวถอดรหัส GPT
positional_embeddings.py : การสร้างการฝังตำแหน่ง
embeddings.py : การสร้าง TOKEN EMBEDDINGS
attention.py : กลไกการดูแลตนเอง
feed_forward.py : เครือข่ายประสาทส่งไปข้างหน้า
lr_schedule.py : การกำหนดค่าอัตราการเรียนรู้
utils.py : ฟังก์ชั่นยูทิลิตี้สำหรับการฝึกอบรมและการอนุมาน
loss_functions.py : ฟังก์ชั่นการสูญเสียที่กำหนดเอง
metrics.py : ตัวชี้วัดการประเมินที่กำหนดเอง
streamer.py : Data Streamer สำหรับการฝึกอบรมที่มีประสิทธิภาพ
gpt_model.py : การใช้งาน Main GPT Model
bpe_tokenizer.py : tokenizer สำหรับการเข้ารหัส BPE (การเข้ารหัสคู่ไบต์)
tokenizer.py : Tokenizer GPT ที่ผ่านการฝึกอบรมมาก่อน
prepare_dataset.py : ไฟล์ที่เราดำเนินการบางอย่างในชุดข้อมูล (การสร้างโฟลเดอร์พิเศษสำหรับข้อมูลการตรวจสอบความถูกต้อง)
inferance.py : ไฟล์ที่จำเป็นในการสร้างประโยคจากโมเดลตามพรอมต์อินพุต
tmp/ : ไดเรกทอรีสำหรับการจัดเก็บจุดตรวจแบบจำลอง
demo/ : เอกสารโครงการ
tokenizer/ : ไดเรกทอรีสำหรับการบันทึก tokenizer ใหม่
dummy_data/ : ไดเรกทอรีที่เราใส่ข้อมูลบางอย่างเพื่อทดสอบสตรีม

ความต้องการ

Python 3.10.6
Tensorflow 2.12.0
Transformers 4.33.2 (สำหรับ Tokenizer)

เอกสาร

เอกสารโครงการโดยละเอียดสามารถพบได้ใน demo/ Directory มันมีคำอธิบายเกี่ยวกับสถาปัตยกรรม GPT ขั้นตอนการฝึกอบรมและวิธีการใช้แบบจำลองสำหรับงานการประมวลผลภาษาธรรมชาติต่างๆ

การใช้งาน

โคลนที่เก็บ:

git clone https://github.com/AliHaiderAhmad001/GPT-from-Scratch-with-Tensorflow.git
cd GPT-from-Scratch-with-Tensorflow

สร้างสภาพแวดล้อมเสมือนจริง (เป็นทางเลือก แต่แนะนำ):
```
python -m venv venv
source venv/bin/activate  # On Windows: venvScriptsactivate
```
ติดตั้งการพึ่งพาโครงการ:
```
pip install -r requirements.txt
```
ดาวน์โหลดและเตรียมชุดข้อมูล: คุณสามารถไปและตรวจสอบการสาธิตคุณสามารถทำงานในชุดข้อมูลเดียวกันเปลี่ยนหรือปรับการตั้งค่าของคุณ อย่างไรก็ตามคุณสามารถดาวน์โหลดชุดข้อมูลได้โดยตรงจากที่นี่ คุณสามารถใช้ส่วนหนึ่งของมันเพื่อตรวจสอบผ่านรหัสต่อไปนี้:
```
python prepare_dataset.py aclImdb/test aclImdb/valid --num_files_to_move 2500
```

ตัวโหลดข้อมูลที่ฉันใช้ต้องตั้งค่าการตรวจสอบความถูกต้องในโฟลเดอร์แยกต่างหาก

ทางเลือกคุณสามารถฝึก GPT tokinizer อีกครั้ง:

python bpe_tokenizer.py aclImdb --batch_size 1000 --vocab_size 50357 --save --save_fp tokenizer/adapted-tokenizer

ฝึกอบรมโมเดล GPT (ให้คำแนะนำที่เฉพาะเจาะจงมากขึ้นหากจำเป็น):
- เพื่อเริ่มการฝึกจากศูนย์: python train.py
- ในการฝึกอบรมต่อจากจุดตรวจ: python train.py --resume

สร้างประโยค คุณสามารถใช้คำสั่งต่อไปนี้เพื่อสร้างข้อความโดยใช้สคริปต์ของคุณ:

python inferance.py " input_text_prompt " --sampler " greedy "  # For greedy sampling

หรือ:

python inferance.py " input_text_prompt " --sampler " beam " --beam_width 5  # For beam search sampling with a beam width of 5

ใบอนุญาต

โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT ดูไฟล์ใบอนุญาตสำหรับรายละเอียด

กิตติกรรมประกาศ

Openai Gpt

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-10
ขนาด 1.17MB
มาจาก Github

แอปที่เกี่ยวข้อง

หลบหนีจาก

2022-08-20
หลบหนีจากทาร์โก

2022-08-09
จูบจากความตาย

2022-08-01
หลบหนีจากเมืองแห่งความหวาดกลัว

2022-07-31
หนีออกจากโรงเรียน

2022-07-29
หลบหนีจากเกาะลิง

2022-07-24

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด