GPT from Scratch with Tensorflow

GPT from Scratch with Tensorflow

كود الذكاء الاصطناعي

1.0.0

تنزيل

Genesismind-Building-GPT-From Drick

GPT "المحول المسبق قبل التدريب" هو الإصدار الأول من سلسلة GPT من النماذج ، التي أحدثت ثورة في معالجة اللغة الطبيعية مع قدرات نمذجة اللغة التلقائية المبنية على بنية المحولات.

ملخص

هذا المشروع هو تطبيق لنموذج GPT (المحول المسبق قبل التدريب) من نقطة الصفر باستخدام TensorFlow. ويشمل جميع مكونات النموذج ، مثل التضمين الموضعي ، وآلية الانتباه ، وطبقات التغذية ، والمزيد.

ملاحظة مهمة: الهدف من هذا المشروع هو توفير فهم عميق لهندسة GPT وأعماله الداخلية. لذلك ، هو أساسا للأغراض التعليمية. يمكنك فهم البنية وآلية العمل لهذا النموذج هنا تمامًا ، واستخدام المكونات التي قمت بتطبيقها في مشاريعك. بشكل عام ، إذا كنت ترغب في استخدام المشروع لتدريب نموذج لغتك بالبيانات الكبيرة ، فقد تحتاج إلى تعديل ملف مجموعة البيانات لتتمكن من معالجة البيانات الكبيرة بشكل أكثر كفاءة. لقد صممت ملف مجموعة البيانات بشكل أساسي للتعامل مع البيانات البسيطة ، وليس كبيرة ، لأنني لست في هذا الصدد الآن.

هناك عدة إصدارات من GPT. يركز هذا التنفيذ بشكل أساسي على تنفيذ "تحسين فهم اللغة من خلال التدريب قبل التدريب".

هيكل المشروع

config.py : ملف التكوين للنموذج hyperparameters.
decoder.py : فك تشفير GPT.
positional_embeddings.py : توليد التضمين الموضعي.
embeddings.py .
attention.py .: آلية الاهتمام الذاتي.
feed_forward.py : الشبكة العصبية التغذية.
lr_schedule.py : جدولة معدل التعلم.
utils.py : وظائف الأداة المساعدة للتدريب والاستدلال.
loss_functions.py : وظائف الخسارة المخصصة.
metrics.py : مقاييس التقييم المخصصة.
streamer.py : دفق البيانات للتدريب الفعال.
gpt_model.py : تنفيذ نموذج GPT الرئيسي.
bpe_tokenizer.py : Tokenizer لـ BPE (ترميز زوج البايت) الرمز المميز.
tokenizer.py : Tokenizer GPT المدربين مسبقًا.
prepare_dataset.py : ملف نقوم من خلاله بإجراء بعض العمليات على مجموعة البيانات (إنشاء مجلد خاص لبيانات التحقق من الصحة).
inferance.py : ملف ضروري لإنشاء جمل من النموذج بناءً على موجه الإدخال.
tmp/ : دليل لتخزين نقاط التفتيش النموذج.
demo/ : وثائق المشروع.
tokenizer/ : دليل لتوفير الرمز المميز.
dummy_data/ : دليل نضع فيه بعض البيانات لاختبار اللافتة.

متطلبات

بيثون 3.10.6
Tensorflow 2.12.0
المحولات 4.33.2 (فقط للرمز المميز)

الوثائق

يمكن العثور على وثائق المشروع التفصيلية في demo/ الدليل. ويشمل تفسيرات لعمارة GPT ، وإجراءات التدريب ، وكيفية استخدام النموذج لمهام معالجة اللغة الطبيعية المختلفة.

الاستخدام

استنساخ المستودع:

git clone https://github.com/AliHaiderAhmad001/GPT-from-Scratch-with-Tensorflow.git
cd GPT-from-Scratch-with-Tensorflow

إنشاء بيئة افتراضية (اختياري ولكن موصى بها):

python -m venv venv
source venv/bin/activate  # On Windows: venvScriptsactivate

تثبيت تبعيات المشروع:
```
pip install -r requirements.txt
```
قم بتنزيل مجموعة البيانات وإعدادها: يمكنك الذهاب ومراجعة العرض التجريبي. يمكنك العمل على نفس مجموعة البيانات ، أو تغييرها أو ضبط تفضيلاتك. ومع ذلك ، يمكنك تنزيل مجموعة البيانات مباشرة من هنا. يمكنك أن تأخذ جزءًا منه للتحقق من الرمز التالي:
```
python prepare_dataset.py aclImdb/test aclImdb/valid --num_files_to_move 2500
```

يتطلب محمل البيانات الذي أستخدمه مجموعة التحقق من الصحة في مجلد منفصل.

اختياريا ، يمكنك إعادة تدريب gpt tokinizer:

python bpe_tokenizer.py aclImdb --batch_size 1000 --vocab_size 50357 --save --save_fp tokenizer/adapted-tokenizer

تدريب نموذج GPT (توفير المزيد من التعليمات المحددة إذا لزم الأمر):
- لبدء التدريب من الصفر: python train.py
- لاستئناف التدريب من نقطة تفتيش: python train.py --resume

توليد جمل. يمكنك استخدام الأمر التالي لإنشاء نص باستخدام البرنامج النصي الخاص بك:

python inferance.py " input_text_prompt " --sampler " greedy "  # For greedy sampling

أو:

python inferance.py " input_text_prompt " --sampler " beam " --beam_width 5  # For beam search sampling with a beam width of 5

رخصة

هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. انظر ملف الترخيص للحصول على التفاصيل.

شكر وتقدير

Openai GPT.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-10
الحجم 1.17MB
من Github

تطبيقات ذات صلة

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل

Genesismind-Building-GPT-From Drick

ملخص

هيكل المشروع

متطلبات

الوثائق

الاستخدام

رخصة

شكر وتقدير

الهروب من

الهروب من تاركو

قبلة من الموت

الهروب من مدينة الإرهاب

الهروب من المدرسة

الهروب من جزيرة القرد

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express