تنزيل programming generative ai - تنزيل رمز مصدر programming generative ai

programming generative ai

كود الذكاء الاصطناعي

1.0.0

تنزيل

برمجة الذكاء الاصطناعي

supercut.mp4

أكثر من 18 ساعة من الفيديو يأخذك على طول الطريق من VAEs إلى الانتشار المستقر في الوقت الفعلي مع Pytorch وعناق الوجه ... مع الكثير من الأمثلة العملية لجعل المتعة العميقة متعة مرة أخرى!

يحتوي هذا المستودع على التعليمات البرمجية والشرائح والأمثلة من دورة فيديو Programming AI.

ملخص

البرمجة التوليدية AI هي جولة عملية في النمذجة العميقة ، وتأخذك من بناء شبكات عصبية بسيطة في Pytorch على طول الطريق إلى العمل مع نماذج كبيرة متعددة الوسائط قادرة على فهم كل من النصوص والصور. على طول الطريق ، سوف تتعلم كيفية تدريب النماذج التوليدية الخاصة بك من نقطة الصفر لإنشاء مجموعة من الصور ، وإنشاء نص مع نماذج لغة كبيرة (LLMs) مماثلة لتلك التي تعمل على تشغيل التطبيقات مثل ChatGPT ، وكتابة خط أنابيب من النص إلى صورة لفهم كيف تعمل النماذج المرتفعة في الواقع ، وتخصيص نماذج كبيرة مسروقة مثل الانتشار المستقر لتوليد صور جديدة في الأنماط المرئية الفريدة (من بين الأشياء الأخرى).

مواد الدورة

الكود والشرائح والتمارين في هذا المستودع (وسوف يكون دائمًا) متاحًا بحرية. يمكن شراء مقاطع الفيديو المقابلة في:

معلومات: شراء فردي انتقائي (40 ٪ خصم مع الرمز: Video40 )
أوريلي التعلم: اشتراك شهري

أسهل طريقة للبدء (مقاطع الفيديو أم لا) هي استخدام بيئة/منصة دفتر سحابة مثل Google Colab (أو Kaggle ، PaperSpace ، إلخ). من أجل الراحة ، قدمت روابط إلى أجهزة الكمبيوتر المحمولة Jupyter Raw للتطوير المحلي ، رابط NBViewer إذا كنت ترغب في تصفح الكود دون استنساخ الريبو (أو يمكنك استخدام عارض GitHub المضمن) ، ورابط كولاب إذا كنت ترغب في تشغيل الكود بشكل تفاعلي دون إعداد بيئة تطوير محلية (والقتال مع مكتبات CUDA).

دفتر	الشرائح	NBViewer (ثابت)	جوجل كولاب (تفاعلي)
الدرس 1: ماذا ولماذا وكيف من الذكاء الاصطناعي التوليدي	PDF
الدرس 2: Pytorch for the Downer	PDF
الدرس 3: الفضاء الكامن يحكم كل شيء من حولي	PDF
الدرس 4: إزالة الغموض عن الانتشار	PDF
الدرس 5: توليد وترميز النص مع المحولات	PDF
الدرس 6: توصيل النص والصور	PDF
الدرس 7: إجراءات ما بعد التدريب لنماذج الانتشار	PDF

إذا وجدت أي أخطاء في الكود أو المواد ، فيرجى فتح مشكلة github أو إرسال بريد إلكتروني إلى [email protected].

الإعداد المحلي

git clone https://github.com/jonathandinu/programming-generative-ai.git
cd programming-generative-ai

الكود الذي تم تنفيذه واختباره باستخدام Python 3.10.12 (من المحتمل أن تعمل الإصدارات الأخرى> = 3.8 بشكل جيد ولكن حذار المشتري ...). لتثبيت جميع الحزم المستخدمة عبر دفاتر الملاحظات في بيئة افتراضية محلية:

 # pyenv install 3.10.12
python --version
# => Python 3.10.12

python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

إذا كان استخدام pyenv لإدارة إصدارات Python ، فيجب على pyenv استخدام الإصدار المذكور تلقائيًا في .python-version عند التحول إلى هذا الدليل.

بالإضافة إلى ذلك ، يتم إعداد دفاتر الملاحظات باستخدام خلية لتحديد جهاز مناسب (GPU) تلقائيًا بناءً على ما هو متاح. إذا كان على جهاز Windows أو Linux ، فيجب أن يعمل كل من NVIDIA و AMD وحدات معالجة الرسومات (على الرغم من أن هذا قد تم اختباره فقط مع NVIDIA). وإذا كان على MAC Silicon Mac ، فسيتم استخدام تظليل الأداء المعدني.

 import torch

# default device boilerplate
device = (
    "cuda" # Device for NVIDIA or AMD GPUs
    if torch . cuda . is_available ()
    else "mps" # Device for Apple Silicon (Metal Performance Shaders)
    if torch . backends . mps . is_available ()
    else "cpu"
)
print ( f"Using { device } device" )

إذا لم يكن من الممكن العثور على جهاز متوافق ، فسيتم افتراضي إلى الواجهة الخلفية لوحدة المعالجة المركزية. يجب أن يكون هذا جيدًا للدروس 1 و 2 ولكن لأي من أمثلة توليد الصور (إلى حد كبير كل شيء بعد الدرس 2) ، من المحتمل أن يكون استخدام وحدة معالجة الرسومات بطيئًا بشكل غير مريح - في هذه الحالة أوصي باستخدام روابط Google Colab في الجدول أعلاه.

مستوى المهارة

وسيطة إلى متقدمة

تعلم كيف

قم بتدريب Autoencoder المتغير (VAE) مع Pytorch لتعلم مساحة كامنة مضغوطة من الصور.
توليد وتحرير الوجوه الإنسانية الواقعية مع نماذج نشر غير مشروطة و SDEDIT.
استخدم نماذج لغة كبيرة مثل GPT2 لإنشاء نص مع محولات الوجه المعانقة.
إجراء بحث الصور الدلالي المستندة إلى النص باستخدام نماذج متعددة الوسائط مثل المقطع.
قم برمجة خط أنابيب النص الخاص بك إلى فهم كيفية عمل النماذج التوليدية المستندة إلى المطالبة مثل الانتشار المستقر بالفعل.
تقييم النماذج التوليدية بشكل صحيح ، من الناحية النوعية والكمية.
صور توضيحية تلقائيًا باستخدام نماذج الأساس المسبق.
قم بإنشاء الصور بأسلوب مرئي معين عن طريق نشر مستقر جيدًا بكفاءة مع Lora.
قم بإنشاء صور شخصية منظمة العفو الدولية من خلال تعليم نماذج الانتشار المسبق مواضيع ومفاهيم جديدة مع Dreambooth.
توجيه بنية وتكوين الصور التي تم إنشاؤها باستخدام ControlNets العمق والحافة.
أداء بالقرب من الاستدلال في الوقت الفعلي مع SDXL Turbo لترجمة الفيديو إلى الفيديو القائم على الإطار.

من يجب أن يأخذ هذه الدورة

المهندسون والمطورين المهتمين ببناء أنظمة وتطبيقات الذكاء الاصطناعي.
علماء البيانات المهتمين بالعمل مع نماذج التعلم العميق الحديثة.
الطلاب والباحثون والأكاديميين الذين يبحثون عن مورد تطبيقي أو عملي لاستكمال معرفتهم النظرية أو المفاهيمية.
الفنانون الفنيون والمبرمجين المبدعون الذين يرغبون في زيادة ممارستهم الإبداعية.
أي شخص مهتم بالعمل مع الذكاء الاصطناعى التوليدي الذي لا يعرف أين أو كيفية البدء.

المتطلبات الأساسية

برمجة مريحة في بيثون
معرفة أساسيات التعلم الآلي
ستكون الألفة بالتعلم العميق والشبكات العصبية مفيدة ولكنها غير مطلوبة

أوصاف الدرس

الدرس 1: ماذا ولماذا وكيف من الذكاء الاصطناعي التوليدي

يبدأ الدرس 1 بمقدمة لما هو في الواقع من الذكاء الاصطناعي ، على الأقل لأنه مناسب لهذه الدورة ، قبل الانتقال إلى تفاصيل النمذجة التوليدية العميقة. ويغطي عدد كبير من النماذج المتعددة الوسائط المحتملة (من حيث طرائق الإدخال والمخرجات) وكيف يمكن للخوارزميات لتوليد وسائط غنية على ما يبدو من الهواء. يختتم الدرس قليلاً من إضفاء الطابع الرسمي ونظرية النماذج التوليدية العميقة ، والمقايضات بين الأنواع المختلفة من بنية النمذجة التوليدية.

الدرس 2: Pytorch for the Downer

يبدأ الدرس 2 بمقدمة إلى Pytorch وأطر التعلم العميق بشكل عام. أريكم كيف أن الجمع بين التمايز التلقائي والحساب الشفاف على وحدات معالجة الرسومات قد مكّن حقًا الانفجار الحالي لأبحاث التعلم العميق والتطبيقات. بعد ذلك ، أريكم كيف يمكنك استخدام Pytorch لتنفيذ وتعلم نموذج الانحدار الخطي - كحجر انطلاق لبناء شبكات عصبية أكثر تعقيدًا. أخيرًا ، يختتم الدرس من خلال الجمع بين جميع المكونات التي يوفرها Pytorch لبناء Perceptron متعدد الطبقات.

الدرس 3: الفضاء الكامن يحكم كل شيء من حولي

يبدأ الدرس 3 بمباراة تمهيدية حول كيفية تمثيل برامج الكمبيوتر فعليًا صورًا كأرقام من الأرقام. أقوم بتغطية تفاصيل الشبكات العصبية التلافيفية والميزات المعمارية المحددة التي تمكن أجهزة الكمبيوتر "من رؤيتها". بعد ذلك ، تحصل على ذوقك الأول من النماذج المتغيرة الكامنة عن طريق بناء وتدريب مشفر تلقائي بسيط لتعلم تمثيل مضغوط لصور الإدخال. في نهاية الدرس ، تواجه أول نموذج توليلي مناسب عن طريق إضافة أخذ العينات الاحتمالية إلى بنية الشفرات التلقائية للوصول إلى Autoencoder التباين (VAE) - مكون رئيسي في النماذج التوليدية المستقبلية التي سنواجهها.

الدرس 4: إزالة الغموض عن الانتشار

يبدأ الدرس 4 بمقدمة مفاهيمية لنماذج الانتشار ، وهو مكون رئيسي في الحالة الحالية للأنظمة النصية إلى النص مثل الانتشار المستقر. الدرس 4 هو أول مقدمة حقيقية لك للنظام الإيكولوجي للوجه المعانقة للمكتبات مفتوحة المصدر ، حيث سترى كيف يمكننا استخدام مكتبة الناشرون لإنشاء صور من ضوضاء عشوائية. ثم يقوم الدرس بتقشير الطبقات على المكتبة ببطء لتفكيك عملية الانتشار ويظهر لك تفاصيل كيفية عمل خط أنابيب الانتشار بالفعل. أخيرًا ، تتعلم كيفية الاستفادة من العمليات الفريدة لعملية تقليل التكرار في نموذج الانتشار للالتحاق بين الصور ، وأداء الترجمة صورة إلى صورة ، وحتى استعادة الصور وتعزيزها.

الدرس 5: توليد وترميز النص مع المحولات

مثلما كان الدرس 4 يدور حول الصور ، فإن الدرس 5 يدور حول النص. يبدأ بمقدمة مفاهيمية لخط أنابيب معالجة اللغة الطبيعية ، بالإضافة إلى مقدمة في النماذج الاحتمالية للغة. ثم تتعلم كيف يمكنك تحويل النص إلى تمثيل أكثر فهمًا من خلال النماذج التوليدية ، واستكشاف الأداة الأوسع لتمثيل الكلمات كمتجهات. ينتهي الدرس بمعالجة بنية المحولات ، حيث سترى كيف يمكنك استخدام مكتبة محولات الوجه المعانقة لأداء الاستدلال مع نماذج لغة كبيرة مدربة مسبقًا (LLMs) لإنشاء نص من نقطة الصفر.

الدرس 6: توصيل النص والصور

يبدأ الدرس 6 بمقدمة مفاهيمية للنماذج متعددة الوسائط والمكونات المطلوبة المطلوبة. ترى كيف يتعلم التدريب اللغوي المتباين مسبقًا نموذجًا مشتركًا من الصور والنص ، وتعلم كيف يمكن استخدام هذه المساحة الكامنة المشتركة لإنشاء محرك بحث عن الصور الدلالي. ينتهي الدرس بنظرة عامة مفاهيمية لنماذج الانتشار الكامن ، قبل تفكيك خط أنابيب انتشار مستقر لمعرفة كيف يمكن أن تقوم أنظمة النص بالتحول بالتحويل إلى صورة مستخدم إلى صورة لم يسبق لها مثيل.

الدرس 7: إجراءات ما بعد التدريب لنماذج الانتشار

الدرس 7 هو كل شيء عن تكييف وزيادة النماذج المتعددة الوسائط الموجودة قبل التدريب. إنه يبدأ بمهمة أكثر دنيوية ، ولكنها ذات أهمية استثنائية ، لتقييم النماذج التوليدية قبل الانتقال إلى الأساليب والتقنيات لضبط دقيق فعال. ثم تتعلم كيفية تعليم نموذج نص إلى نص تدريبي مسبقًا مثل الانتشار المستقر حول الأنماط والموضوعات والشروط الجديدة. ينتهي الدرس بتقنيات لجعل الانتشار أكثر كفاءة في الاقتراب بالقرب من توليد الصور في الوقت الفعلي.

إشعار وترخيص حقوق الطبع والنشر

للحصول على إذن لاستخدام المحتوى في العرض التقديمي الخاص بك (منشورات المدونة ، المحاضرات ، مقاطع الفيديو ، الدورات ، إلخ) ، يرجى الاتصال بـ [email protected].

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-07
الحجم 158.06MB
من Github

تطبيقات ذات صلة

The Ultimate C Programming Course

2024-11-12
awesome generative ai guide

2024-11-05
أمامه

2024-07-08
منظمة العفو الدولية الخالق

2023-04-23
جاسبر منظمة العفو الدولية

2023-04-12
الذكاء الاصطناعي الفضائي

2022-07-29

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل