نماذج تنكسية رهيبة
قائمة منسقة من الأطر النموذجية الرائعة والمكتبات والبرامج والموارد لإنتاج الوسائط
مستوحاة من رهيبة بيثون

يتم دعم عملي مفتوح المصدر من قبل المجتمع
- MDELs التوليدية رهيبة
- توليد الكود: خوارزمية ML + تحليل ثابت
- رمز إلى واجهة المستخدم الرسومية: خوارزمية لواجهة المستخدم
- تخليق الصور
- توليد النص/NLP
- توليد/معالجة الصوت والموسيقى
- توليف الموسيقى والفيديو
- تلاشي الفيديو
- الجيل الإجرائي للألعاب
- توليد الصورة
- المنتدى
رمز إلى واجهة المستخدم الرسومية: خوارزمية لواجهة المستخدم:
- لقطة الشاشة إلى الكود
- PIX2CODE: توليد رمز من لقطة شاشة واجهة مستخدم رسومية
- Bred Victor: التعلم الآلي في الاستدلال الهندسي من EnviMent
توليد الكود: خوارزمية ML + تحليل ثابت
- Tabnine: الإكمال التلقائي مع التعلم العميق
- طائرة ورقية: إكمال المبرمج بمساعدة الخوارزمية
- Insignt: لا تزال أدوات إكمال الكود القياسية تستخدم الفرز الأبجدي ، بينما تستخدم Kite خوارزميات ML لاستنتاج ما يحاول المطور القيام به على الأرجح
تخليق الصور
- Spade by NVLABS: تصنيع الصور الواقعية المعطاة لتخطيط دلالي إدخال. شفرة
نقل نمط الصورة
ArtbreEder على أساس Biggan Models OpenSource Person
مشروع فني رائع: ... dgspitzer (Eddie Hu) يستخدم صانع ألعاب مستقلة Artbreeder استنادًا إلى نماذج Biggan و Stylegan-Artm واقعية-neural_talking_head_modelsm first-Order_Modelsm Dain و Topaz Lab للحصول على بعض الأعمال الرائعة على إصلاح الفيديو الرقمي ، والذي يلوين أسود وأثناء الفيديو.
مشروع رائع: رواية مرئية باستخدام نقل نمط ML
NLP: تحليل النص:
- DeepMoji: نموذج تحليل المشاعر يستخدم هذا النموذج أيضًا في 15.AI ، وهي أداة نص إلى كلام لتوليد أصوات من مختلف الأحرف.
نص إلى صورة:
- مجموعة البيانات: مجموعة بيانات مصادر مفتوحة المصدر من Google
نص إلى video:
- Allennlp: تخيل هذا! البرامج النصية للتراكيب لمقاطع الفيديو
التسمية التوضيحية للصور
- Tensorflow Core: تسميات توضيحية للصورة مع الاهتمام البصري
نص إلى آخر
- توليد الرسوم المتحركة من السيناريو
توليد النص/NLP
توليد الأسئلة:
- توليد الأسئلة: قم بإنشاء إجابات متعددة الخيارات من النص
آخر
- Openai 1.5 مليار Params إصدار GPT-2
- Aidungeon
- Ctrl-GCE: نموذج توليد النص CTRL على محرك Google Compute مع عدد قليل من أوامر وحدة التحكم. ، لماذا Google Compute Engine: نموذج CTRL كبير جدًا (12 جيجابايت على القرص ، 15.5 غيغابايت GPU VRAM عند تحميله ، حتى المزيد من ذاكرة الوصول العشوائي أثناء التشغيل) بحيث لا يتلاءم حاليًا في دفتر كولابوري أو كاججل.
- يمكن أن تكون الكتابة مع مجموعة بيانات Machine SciFi Corpus Txt مفيدة لحن GPT2 Model Fine
- GPT2-chinese-wuxiao-novel
- GPT-2 الصينية
- [محول الوجه المعانقة] -Pytorch Hub
Text Corpus/DataSet
- علمي-فاي سكب
- يمكن أن تكون ديترويت بومنغ-هومان مصدرًا لتحليل هيكل شجرة الحوار وشجرة القرار.
توليد/معالجة الصوت والموسيقى
مشروع:
- التحدث مثل شخصيتك المفضلة: البحث المتعلق بتوليد الصوت إلى كلام:
- Tacotron2
- forwardtacotron: tacotron2 بدون اهتمام
- استنساخ الصوت: في الوقت الفعلي ، تشييد الصناديق
- الطحال: إن فصل الصوت في المسار الصوتي يخضع لمجال Retrival لموسيقى Retrival.
- الموسيقى التوليدية المحيطة بقلم Alex Bainter على الرغم من أن هذا المشروع لا يتم إنشاؤه بواسطة الخوارزمية ، فإنه يعطي الكثير من الإلهام في مجال توليد الموسيقى. رمز متوسط *NeuralFunk: تصميم الصوت مع ML
توليف الموسيقى والفيديو
- مرشح الموسيقى العميق باستخدام رمز Biggan
تخليق الفيديو والجيل:
PIX2PIX-Tensorflow: تحديث رمز العالم الظاهري المتداخل Poweed: أضاف نموذجًا أكثر عن كولاب
- باستخدام هذه التقنية ، يمكننا تلوين صور بالأبيض والأسود ، وتحويل خرائط Google إلى Google Earth ، إلخ.
Craft ، التي تقوم بإنشاء الرسوم الكاريكاتورية على أساس نص descritpionsa عمل إبداعي للغاية ينطوي على نص لتوليد الفيديو من Allen NLP بواسطة صفحة مشروع الباحث
نظام الصوت
- تنفيذ NVIDIA TACO2 PYTORCH
- في الوقت الفعلي-فص Clone
الإجراءات الإجرائية
توليد الخريطة
- مولد خريطة الخيال الإجرائي التي تعمل بذوارات الذكاء الاصطناعى ، مرجع: @Linonetwo مدونة
الرسوم المتحركة
- التعلم العميق للرسوم المتحركة والتحكم في الشخصية
- DeepMimic: تقليد الحركة مع التعلم التعزيز العميق
التدريب الموزع:
- MPI يقلل و allreduce تعليمي مفيد جدا لتوضيح مفهوم MPT. تحقق من الرمز
- تحقق أيضًا من TensorFlow-Core
- استراتيجية traning الموزعة
تطبيق رؤية الكمبيوتر في الألعاب
- الكشافة المواهب الإلكترونية استنادًا إلى اكتساب بيانات دفق البيانات المتعددة الوسائط ونمذجة سجل دردشة رمز TWICH
ورقة مع رمز
الموارد في الدورة ذات الصلة:
- UIUC CS598RK: HCI لـ ML
- كورسيرا: نماذج التسلسل
- كومة كاملة التعلم العميق
- Fast.ai
- UIUC: مختبر معالجة الفيديو ECE420
- مورد GPU المجاني: إعداد وحدة معالجة الرسومات على مثيل Google Cloud لـ Fast.ai مجانًا
إعداد الحوسبة السحابية
أدوات التعلم العميقة الكاملة في خط أنابيب معالجة البيانات:
- القشرة: نشر نماذج التعلم الآلي في الإنتاج ربما بدون Docker و Kubernetes المتوسطة
موارد أداة DEV:
- Lumen: برنامج Syth فيديو
- محرر العقدة القائم على شجرة الحوار للوحدة والمثال التجريبي
المزيد من الموارد على النموذج المسبق:
- [Pytorch Hub] https://pytorch.org/hub/research-models
- TensorFlow Hub
قابل الأشخاص المرتبطين بالعقل في المنتدى:
طلب:
توليد أصوات من مختلف الشخصيات: من الناحية المثالية البودكاست والألعاب وما إلى ذلك:
صنع الأفلام:
- المرآة السوداء: عرض Bandersnatch: شجرة الحوار
- في وقت متأخر
تصميم
- تصميم خوارزمية مدفوعة
- خوارزمية ولدت شعار
مرجع:
- للحصول على تفاصيل حول كيفية تمثيل بنية الرسوم المتحركة من منظور البرنامج وفي الرياضيات. تحقق من applick-enimation نظام هندسة محرك اللعبة ، الطبعة الثانية بقلم جيسون غريغوري
- نموذج الذكاء الاصطناعى الجديد في Kite