تنزيل machine learning curriculum - تنزيل رمز المصدر machine learning curriculum

machine learning curriculum

بايثون

1.0.0

تنزيل

منهج التعلم الآلي

التعلم الآلي هو فرع من الذكاء الاصطناعي المخصص لجعل الآلات يتعلم من بيانات الملاحظة دون برمجة بشكل صريح.

التعلم الآلي و AI ليسا متماثلين. التعلم الآلي هو أداة في Symphony AI - مكون من AI. إذن ما هو التعلم الآلي - أو ML - بالضبط؟ إنها قدرة خوارزمية على التعلم من البيانات السابقة من أجل إنتاج سلوك. ML تقوم بتدريس الآلات لاتخاذ القرارات في المواقف التي لم يسبق لهم رؤيتها.

تم صنع هذا المنهج لإرشادك لتعلم التعلم الآلي ، والتوصية بالأدوات ، ومساعدتك على احتضان نمط حياة ML من خلال اقتراح الوسائط لمتابعة. أقوم بتحديثها بانتظام للحفاظ على النضارة والتخلص من المحتوى الذي عفا عليه الزمن والأدوات التي تم إهمالها.

التعلم الآلي بشكل عام

ادرس هذا القسم لفهم المفاهيم الأساسية وتطوير الحدس قبل التعمق.

يقال إن برنامج الكمبيوتر يتعلم من التجربة E فيما يتعلق ببعض فئات المهام T و Measure Performance P إذا كان أدائه في المهام في T ، كما تم قياسه بواسطة P ، يتحسن مع Experience E

عناصر من منظمة العفو الدولية مجموعة من الدورات السهلة التي تدرس الذكاء الاصطناعي والتعلم الآلي
COMS W4995 Applied Machine Learning Spring 2020 مقاطع فيديو وشرائح من دورة ML التطبيقية من جامعة كولومبيا.
دورة التعلم الآلي الرأي بواسطة Fast.ai
دورة تحطم التعلم الآلي مع APIS APIs TensorFlow APIs Google مقدمة عملية وعملية للتعلم الآلي
مقدمة للتعلم الآلي - Udacity Hands on Scikit -Learn (Python) تعلم البرمجة على مفاهيم ML الأساسية
التعلم الآلي: خاضع للإشراف ، غير خاضع للإشراف وتعزيز - udacity المدربين 2 فرحان
إتقان التعلم الآلي تم وضعه بعناية دليل خطوة بخطوة لبعض الخوارزميات معينة
أوصت تخصص Andrew NG في Coursera للأشخاص الذين يرغبون في معرفة تفاصيل خوارزميات ML تحت الغطاء ، وفهم ما يكفي من الرياضيات لتكون خطرة والقيام بمهام الترميز في بيثون
وصفات ML - قائمة تشغيل YouTube محتوى ملموسًا مصممًا بشكل جيد ل ML مقدمة
التعلم الآلي هو الجزء 1 نهج بسيط للتعلم الآلي لأشخاص غير آذان
التعلم الآلي مع Python - قائمة تشغيل YouTube
التعلم الآلي يتوق إلى أندرو نغ
هبوط وظيفة البيانات: الدورة هي مبدأ توجيهي وعملي للأشخاص الذين يرغبون في التركيز على هبوط الوظيفة. على سبيل المثال ، يقترحون أن معرفة كيفية عمل شجرة القرار جيدة بالفعل ، لا تحتاج إلى معرفة كيفية عمل جميع النماذج ، وهذا صحيح! ولكن هذه النصيحة مخصصة في الغالب للبيانات الجدولية.
التعلم الآلي الخادم ببناء خدمة التنبؤ بدون خادم الآلة الخاصة بك
MLOPs الفعالة: تطوير النموذج مسار مجاني حسب الأوزان والتحيزات مع شهادة
الرياضيات للتعلم الآلي وعلوم البيانات تخصص دورة الرياضيات من قبل كورسيرا

كتب

التعلم الآلي مع Pytorch و Scikit-Learn من قبل Sebastian Raschka
يعد التعلم الآلي العملي مع Scikit-Learn و Keras و TensorFlow ، الإصدار الثاني من Aurélien Géron هو أفضل كتاب مبيع لأنه رائع.
https://github.com/fastai/fastbook كتاب Fastai ، الذي نُشر كـ Jupyter Notebooks
https://www.deeplearningbook.org/ كتاب Math Heavy Book by Ian Goodfellow و Yoshua Bengio و Aaron Courville
https://christophm.github.io/interpretable-ml-book/ دليل لجعل نماذج الصناديق السوداء قابلة للتفسير
https://themlbook.com/ كتاب التعلم الآلي المائة من أندري بوركوف

التعلم التعزيز

إن بناء آلة تستشعر البيئة ثم يختار أفضل سياسة (إجراء) للقيام بها في أي حالة معينة لزيادة مكافأتها العددية على المدى الطويل المتوقع هو هدف التعلم التعزيز.

Openai Spinning هذا هو مورد تعليمي أنتجته Openai مما يجعل من السهل التعرف على تعلم التعزيز العميق (Deep RL).
تعلم التعزيز الأساسي سلسلة مقدمة للتعلم التعزيز (RL) مع دروس شاملة خطوة بخطوة.
الموضوعات المتقدمة: RL 2015 (COMPM050/COMPGI13) بقلم David Silver (الرجل الذي يقف خلف Alphago)
كتاب مقدمة لريتشارد سوتون وأندرو ج. بارتو
تعلم التعزيز العميق: بونغ من وحدات البكسل
المحاضرة 10: التعلم التعزيز - يوتيوب
ورقة مسح
تعلم التعزيز العميق: برنامج تعليمي - Openai
CS 294: تعلم التعزيز العميق ، ربيع 2017

التعلم العميق

التعلم العميق هو فرع للتعلم الآلي حيث تجد الشبكات العصبية الاصطناعية العميقة (DNN) - الخوارزميات المستوحاة من الطريقة التي تعمل بها الخلايا العصبية في الدماغ - أنماطًا في البيانات الخام من خلال الجمع بين طبقات متعددة من الخلايا العصبية الاصطناعية. مع زيادة الطبقات ، فإن قدرة الشبكة العصبية على تعلم المفاهيم المجردة بشكل متزايد.

أبسط نوع من DNN هو إدراك متعدد الطبقات (MLP).

كتاب التعلم العميق هذا الكتاب هو مقدمة قصيرة للتعلم العميق للقراء ذوي الخلفية الجذعية ، المصممة أصلاً ليتم قراءتها على شاشة الهاتف. يتم توزيعه بموجب ترخيص المشاع الإبداعي غير التجاري وتم تنزيله على ما يقرب من 250000 مرة في الشهر التالي لإصداره العام.
التعلم العميق المكدس الكامل تعلم التعلم العميق على مستوى الإنتاج من كبار الممارسين
deeplearning.ai مجموعة من الدورات التي يدرسها أندرو نغ في كورسيرا ؛ إنها تكملة دورة التعلم الآلي في Coursera.
مقدمة للتعلم العميق مع Pytorch دورة من قبل Facebook AI على udacity
مقدمة ودية للتعلم العميق والشبكات العصبية
عبث ملعب الشبكة العصبية مع شبكة عصبية بسيطة مصممة لمساعدتك على تصور عملية التعلم
التعلم العميق غير المصحول - يوتيوب يشرح مصدر إلهام للتعلم العميق من الخلايا العصبية الحقيقية إلى الشبكات العصبية الاصطناعية
تعلم Tensorflow والتعلم العميق ، بدون دكتوراه توفر هذه الدورة التدريبية التي استمرت 3 ساعات (فيديو + شرائح) للمطورين مقدمة سريعة لأساسيات التعلم العميق ، مع إلقاء بعض Tensorflow في الصفقة.
دليل للتعلم العميق من قبل YN^2 دليل الرياضيات المنسق للتعلم العميق
دورة التعلم العميق العملي للمبرمجين في Fast.ai قام بتدريسها جيريمي هوارد (منافس Kaggle رقم 1 على التوالي ، ومؤسس Enlitic)
التعلم العميق - يوصى باستخدام المتعلم البصري الذي يعرف بعض ML ، ويوفر هذه الدورة أفكارًا عالية المستوى للتعلم العميق ، والتفاصيل البديهية الكثيفة التي تم وضعها في فترة زمنية قصيرة ، وسوف تستخدم Tensorflow داخل الدورة التدريبية
مدرسة الصيف التعليمية العميقة ، مونتريال 2015
فئة الشبكات العصبية - قائمة تشغيل YouTube
http://neuralnetworksanddeeplearning.com/index.html كتاب عملي على الإنترنت لحدس الرياضيات التعليمية العميقة ، أستطيع أن أقول أنه بعد الانتهاء من ذلك ، ستتمكن من شرح التعلم العميق بتفاصيل دقيقة.
حديقة حيوانات الشبكة العصبية مجموعة من نماذج الشبكات العصبية التي يجب أن تعرف عنها (أعرف حوالي نصفها ، لذلك لا تقلق من أنك لا تعرف الكثير لأن معظمها ليسوا شائعين أو مفيدين في الوقت الحاضر)
مقدمة إلى TensorFlow للتعلم العميق الذي تم تدريسه في Udacity
الاشعال • الذكاء الاصطناعى هنا مجموعة مختارة من المقالات عن أساسيات/مفاهيم الذكاء الاصطناعى التي تغطي العملية بأكملها لبناء الشباك العصبية لتدريبها على تقييم النتائج. هناك أيضًا شرح بنية محول مفصلة للغاية.
تعانق نماذج نشر الوجه ، تعلم النظرية ، وتدريب النموذج من الصفر ، واستخدامه لإنشاء الصور والصوت.
أساسيات التعلم العميق بواسطة Lightning.ai مع Sebastian Raschka

الشبكات العصبية التلافيفية

DNNs التي تعمل مع بيانات الشبكة مثل الأشكال الموجية الصوتية والصور ومقاطع الفيديو أفضل من DNNs العادية. وهي تستند إلى الافتراضات بأن وحدات الإدخال القريبة أكثر ارتباطًا من الوحدات البعيدة. كما أنها تستخدم ثبات الترجمة. على سبيل المثال ، بالنظر إلى صورة ، قد يكون من المفيد اكتشاف نفس الحواف في كل مكان على الصورة. يطلق عليهم في بعض الأحيان Convnets أو CNNs .

كيف تعمل الشبكات العصبية التلافيفية - شرح تقني على YouTube بما في ذلك عمليات التجميع ، RELU ، طبقة متصلة بالكامل ، التحسين باستخدام نزول التدرج
الشبكة العصبية التي تغير كل شيء - الكمبيوتر
دليل المبتدئين لفهم الشبكات العصبية "
التعلم العميق لرؤية الكمبيوتر (Andrej Karparthy ، Openai) هذا هو مقطع الفيديو المفضل لدي للشبكة التلافيفية. يشرح Andrej Invelive بالتفصيل الإجابة على جميع الأسئلة الغريبة التي قد يكون لدى المرء. على سبيل المثال ، تتحدث معظم المقالات فقط عن الالتفاف في صورة رمادي ، لكنه يصف الالتفاف في الصور ذات قنوات الألوان أيضًا. كما يتحدث عن المخاوف والافتراضات التي يضعها القنوات. هذه محاضرة رائعة!
يفسر فهم الشبكات العصبية من خلال التصور العميق كيفية تصور مقنع باستخدام تقنيات مختلفة

الشبكات العصبية المتكررة

DNNs التي لها دول. كما أنهم يفهمون التسلسلات التي تختلف في الطول. يطلق عليهم في بعض الأحيان rnns .

http://karpathy.github.io/2015/05/21/rnn-effectively/
http://colah.github.io/posts/2015-08-ressingleshing-lstms/
http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-bart-1-introduction-to-rnns/

أفضل الممارسات

قواعد التعلم الآلي: أفضل الممارسات لهندسة ML ، إنها وثيقة من قبل Martin Zinkevich حول أفضل ممارسات Google في التعلم الآلي.
وصفة لتدريب الشبكات العصبية أندريج المدونة حول كيفية تدريب نفسك على أن تكون مهندس تعلم الآلة بجنون العظمة.
كيفية تصحيح الشبكات العصبية. يدوي.
نظرة عامة على خوارزميات تحسين النسب التدرج
كتاب Playbook التعلم العميق هو كتاب اللعب لزيادة أداء نماذج التعلم العميق بشكل منهجي.

أدوات

المكتبات والأطر المفيدة للتعلم الآلي العملي

الأطر

لبنات بناء التعلم الآلي

مكتبة Scikit-Learn General Machine Learning Library ، تجريد عالي المستوى ، موجه نحو المبتدئين
Tensorflow رهيبة Tensorflow. إطار عمل الرسم البياني للحساب الذي صممه Google ، يحتوي على لوحة تصور لطيفة ، وربما يكون الإطار الأكثر شعبية في الوقت الحاضر للقيام بالتعلم العميق
Keras: التعلم العميق للبشر Keras هو واجهة برمجة تطبيقات تعليمية عميقة مكتوبة في Python ، يمتد فوق TensorFlow. لا يزال ملك التجريد العالي المستوى للتعلم العميق. تحديث: Keras متاح الآن لـ TensorFlow و Jax و Pytorch!
PYTORCH TENSORS والشبكات العصبية الديناميكية في بيثون مع تسارع GPU قوي. يستخدم بشكل شائع من قبل الباحثين المتطورين بما في ذلك Openai.
Lightning إطار التعلم العميق لتدريب منتجات AI ونشرها وشحنها بسرعة. (اعتاد أن يطلق عليه Pytorch Lightning)
Jax هو Autograd و XLA ، يجمع بين أبحاث التعلم الآلي عالي الأداء.
OneFlow هو إطار عمل تعليمي عميق مصمم ليكون سهل الاستخدام وقابل للتطوير وفعال.
يعد Apache MXNET (الحضانة) للتعلم العميق Apache MXNET إطارًا تعليميًا عميقًا مصممًا لكل من الكفاءة والمرونة. يسمح لك بخلط البرمجة الرمزية والضرورية لزيادة الكفاءة والإنتاجية إلى الحد الأقصى.
Chainer إطار مرن للشبكات العصبية للتعلم العميق
Vowpal Wabbit هو نظام تعلم آلي يدفع حدود التعلم الآلي بتقنيات مثل عبر الإنترنت ، التجزئة ، Allreduce ، التخفيضات ، التعلم 2search ، النشط ، والتعلم التفاعلي. هناك تركيز محدد على التعلم التعزيز مع العديد من خوارزميات اللصوص السياقية التي تم تنفيذها والطبيعة عبر الإنترنت التي تقرض المشكلة جيدًا.
H2O هو منصة في الذاكرة للتعلم الآلي القابل للتطوير الموزعة.
Spektral الرسم البياني الشبكات العصبية مع keras و TensorFlow 2.
Ivy هو جهاز Transpiler ML وإطار عمل يدعم حاليًا Jax و TensorFlow و Pytorch و Numpy. Ivy يوحد جميع أطر ML؟ تمكينك ليس فقط من كتابة التعليمات البرمجية التي يمكن استخدامها مع أي من هذه الأطر كواجهة خلفية ، ولكن أيضًا لتحويل أي وظيفة أو طراز أو مكتبة مكتوبة في أي منها إلى إطارك المفضل!

لا ترميز

Ludwig Ludwig هو صندوق أدوات يتيح للمستخدمين تدريب واختبار نماذج التعلم العميق دون الحاجة إلى كتابة التعليمات البرمجية. وهي مبنية على قمة Tensorflow.

تعزيز التدرج

النماذج التي يتم استخدامها بشكل كبير في المسابقات بسبب أداء التعميم المتميز.

https://github.com/dmlc/xgboost تعزيز التدرج المتطرف
https://github.com/microsoft/lightgbm بديل خفيف الوزن مقارنة بـ xgboost
https://github.com/catboost/catboost مجموعة تدرج سريعة وقابلة للتطوير وعالية الأداء على مكتبة أشجار القرار ، وتستخدم في التصنيف والتصنيف والانحدار وغيرها من مهام التعلم الآلي للبيثون ، R ، Java ، C ++. يدعم الحساب على وحدة المعالجة المركزية و GPU.
https://github.com/tensorflow/decision-forests tensorflow قرار القرار (TF-df) هي مجموعة من الخوارزميات الحديثة للتدريب وخدمة وتفسير نماذج غابات القرار.
Pytorch/TensorFlow تنفيذ ورقة TabNet. قراءة مزيد من: توازنات TabNet قابلية التوضيح وأداء النموذج على البيانات الجدولية ، ولكن هل يمكن أن يعزز نماذج الأشجار المزودة؟

استدلال السلسلة الزمنية

تتطلب بيانات السلاسل الزمنية عملية استخراج ميزة فريدة من نوعها ليكون قابلة للاستخدام في معظم نماذج التعلم الآلي لأن معظم النماذج تتطلب أن تكون البيانات بتنسيق جدولي. أو يمكنك استخدام بنية نموذجية خاصة تستهدف السلسلة الزمنية على سبيل المثال LSTM ، TCN ، إلخ.

https://github.com/timeseriesai/tsai السلسلة الزمنية الزمنية الزمنية التعلم العميق pytorch fastai-التعلم العميق على أحدث مع سلسلة زمنية وتسلسل في Pytorch/Fastai. قراءة أخرى: تساي - على أحدث التعلم الآلي للسلاسل الزمنية ، الجزء 1.
https://github.com/alan-turing-institute/sktime إطار عمل موحد للتعلم الآلي مع سلسلة زمنية
https://github.com/sktime/sktime-dl حزمة تمديد للتعلم العميق مع TensorFlow/Keras for Sktime
https://github.com/tslearn-team/tslearn/ مجموعة أدوات التعلم الآلي مخصصة لبيانات الفئة الزمنية
https://github.com/blue-yonder/tsfresh الاستخراج التلقائي للميزات ذات الصلة من السلسلة الزمنية
https://github.com/johannfaouzi/Pyts حزمة Python لتصنيف السلسلة الزمنية
https://github.com/facebook/prophet أداة لإنتاج تنبؤات عالية الجودة لبيانات السلاسل الزمنية التي لها موسمية متعددة مع نمو خطي أو غير خطير.
https://github.com/philipperemy/keras-tcn شبكة تلغيرات مؤقتة
الصاروخ: تصنيف سلسلة زمنية سريعة ودقيقة بشكل استثنائي باستخدام نواة تلغيرات عشوائية ؛ Minirocket: تحويل حتمي سريع للغاية (تقريبًا) لتصنيف السلسلة الزمنية ؛ هذه التقنيات 2 لاستخراج ميزات السلاسل الزمنية. قراءة أخرى: صاروخ: تصنيف سلسلة زمنية سريعة ودقيقة

دورة الحياة

المكتبات التي تساعدك على تطوير/تصحيح/نشر النموذج في الإنتاج (MLOPS). هناك ما هو أكثر من ML من تدريب النموذج.

https://huggingface.co/ تمامًا مثل github ، ولكن لتخزين نماذج ML ومجموعات البيانات والتطبيقات (يسمون التطبيقات كمساحات). لديهم مكتبات لك لاستخدام النماذج/مجموعات البيانات الخاصة بهم بسهولة. التخزين مجاني وغير محدود لكل من المشاريع العامة والخاصة.
https://wandb.ai/ بناء نماذج أفضل بشكل أسرع مع تتبع التجربة ، وإصدار مجموعة البيانات ، وإدارة النماذج
https://github.com/flyteorg/flyte flyte يجعل من السهل إنشاء مهام سير عمل متزامنة وقابلة للتطوير ويمكن صيانتها للتعلم الآلي ومعالجة البيانات.
https://github.com/allegroai/clearml جناحًا تلقائيًا من الأدوات لتبسيط سير عمل ML الخاص بك. مدير التجربة ، ML-OPS وإدارة البيانات
https://github.com/quantumblacklabs/kedro إطار بيثون لإنشاء رمز علوم البيانات القابلة للتكرار والقابل للصيانة.
https://github.com/determinated-ai/determined محدد عبارة عن منصة تدريب على التعلم العميق مفتوحة المصدر تجعل بناء نماذج سريعة وسهلة. أستخدمه بشكل رئيسي لضبط المقاييس المفرطة.
https://github.com/iterative/cml التعلم الآلي المستمر (CML) هي مكتبة مفتوحة المصدر لتنفيذ التكامل والتسليم المستمر (CI/CD) في مشاريع التعلم الآلي. استخدمه لأتمتة أجزاء من سير عمل التطوير الخاص بك ، بما في ذلك التدريب والتقييم النموذجي ، ومقارنة تجارب ML عبر تاريخ مشروعك ، ومراقبة مجموعات البيانات المتغيرة.
https://github.com/creme-ml/creme Python Library للتعلم الآلي عبر الإنترنت . يمكن تحديث جميع الأدوات الموجودة في المكتبة مع ملاحظة واحدة في وقت واحد ، وبالتالي يمكن استخدامها للتعلم من بيانات البث.
https://github.com/aimhubio/aim طريقة فائقة للتسجيل والبحث ومقارنة 1000 من عمليات التدريب ML
https://github.com/netflix/metaflow metaflow هي مكتبة بيثون صديقة للإنسان تساعد العلماء والمهندسين على بناء وإدارة مشاريع علم البيانات الواقعية. تم تطوير MetaFlow في الأصل في Netflix.
MLFLOW MLFLOW (حاليًا في BETA) عبارة عن منصة مفتوحة المصدر لإدارة دورة حياة ML ، بما في ذلك التجريب والاستنساخ والنشر. ويوفر حاليًا ثلاثة مكونات: MLFLOW Tracking ، MLFlow Projects ، MLFLOW Models.
Floydhub a heroku للتعلم العميق (تركز على النموذج ، سوف ينشرون)
يمكّن Comet.ML Comet علماء وفرق البيانات من تتبع ومقارنة وشرح وتحسين التجارب والنماذج عبر دورة حياة النموذج بالكامل. من التدريب إلى الإنتاج
https://neptune.ai/ إدارة جميع بيانات بيانات بناء النموذج الخاصة بك في مكان واحد
https://github.com/fastai/nbdev إنشاء مشاريع بيثون مبهجة باستخدام دفتر ملاحظات Jupyter
https://rapids.ai/ علوم البيانات على وحدات معالجة الرسومات
https://github.com/datarevenue-berlin/openmlops
https://github.com/jacopotagliabue/you-dont-need-a-bigger-boat ليس أداة حقًا ، ولكن دليلًا على كيفية تكوين العديد من الأدوات معًا في الأعمال التجارية المعقولة في العالم الحقيقي.
https://www.modular.com/ شركة ذات هدف طموح لإعادة تصميم البنية التحتية لمنظمة العفو الدولية من الألف إلى الياء. يقدمون لغة جديدة تسمى Mojo وهي مجموعة من Python.

سحابة GPU

تذكر أن هذه قائمة رأي. هناك بازليون من مقدمي الخدمات السحابية هناك. لن أدرجهم جميعًا. أنا فقط سأدرج تلك التي أنا على دراية بها وأعتقد أنها جيدة.

https://lightning.ai/ Lightning Studio يجعل من الممكن لك التخلص من الكمبيوتر المحمول المتطرف لتطوير نماذج التعلم الآلي. ما عليك سوى كتابة التعليمات البرمجية في السحابة باستخدام VSCode واستخدم وحدات معالجة الرسومات الخاصة بها للتدريب أو الاستدلال. يشبه Lightning Studio مساحات GitHub ولكن مع GPU.
https://modal.com/ MODAL يتيح لك تشغيل نماذج التعلم الآلي أو نشرها ، وظائف حساب متوازية بشكل كبير ، قوائم انتظار المهام ، تطبيقات الويب ، وأكثر من ذلك بكثير ، دون بنية التحتية الخاصة بك.
https://www.runpod.io/ وفر أكثر من 80 ٪ على وحدات معالجة الرسومات. أصبح استئجار GPU سهلاً مع Jupyter لـ Pytorch أو TensorFlow أو أي إطار عمل AI آخر. لقد استخدمته من قبل. سهل الاستخدام.
https://replicate.com/ Run and Fine-Tune Open-Source Models. نشر نماذج مخصصة على نطاق واسع باستخدام COG. كل ذلك مع سطر واحد من الكود.
https://bentoml.com/ Bentoml هو النظام الأساسي لمهندسي البرمجيات لبناء منتجات AI. نشر باستخدام حزمة bentoml.
https://www.baseten.co/ استدلال نموذج سريع وقابل للتطوير في السحابة باستخدام الجمالون
https://lambdalabs.com/ GPU Cloud تم تصميمه للتعلم العميق. الوصول الفوري إلى أفضل الأسعار ل GPU Cloud في السوق. لا التزامات أو مفاوضات مطلوبة. وفر أكثر من 73 ٪ مقابل AWS و Azure و GCP. تم تكوينه للتعلم العميق مع Pytorch و TensorFlow و Jupyter
https://www.beam.cloud/ على حساب GPU عند الطلب: تدريب ونشر تطبيقات AI و LLM بشكل آمن على وحدات معالجة الرسومات الخوادم ، دون إدارة البنية التحتية

تخزين البيانات

https://github.com/huggingface/datasets/ حزمة للتحميل والمعالجة المسبقة ومشاركة مجموعات البيانات.
https://github.com/activeloopai/Deeplake Data Lake للتعلم العميق. بناء ، إدارة ، الاستعلام ، الإصدار ، وتصور مجموعات البيانات. دفق البيانات في الوقت الفعلي إلى Pytorch/TensorFlow.
https://github.com/determined-ai/yogadl نهج أفضل لتحميل البيانات للتعلم العميق. API-Transparent Caching إلى القرص أو GCS أو S3.
https://github.com/google/ml_collections مجموعات ML هي مكتبة من مجموعات Python مصممة لحالات استخدام ML. أنه يحتوي على تكوين ، هياكل بيانات "تشبه القولان" مع إمكانية الوصول إلى العناصر المتداخلة. من المفترض أن يتم استخدامه كوسيلة رئيسية للتعبير عن تكوينات التجارب والنماذج.

تجميع البيانات

تنظيف البيانات وزيادة البيانات

https://github.com/cgnorthcutt/cleanlab خطأ في وضع علامة على مجموعة البيانات
https://github.com/aleju/imgaug مكتبة تكبير الصور التي تدعم تحويل المفاتيح إلى خرائط الحرارة
https://github.com/albu/albumentations أسرع مكتبة تكبير الصور
https://github.com/mdbloice/augmentor تكبير الصور سهلة الاستخدام لمهام التصنيف (لا يمكن زيادة keypoints)
https://github.com/facebookresearch

تنظيم البيانات

https://github.com/prefecthq/prefect
https://github.com/dagster-io/dagster
https://github.com/ploomber/ploomber ploomber هي أسرع طريقة لبناء خطوط أنابيب البيانات ⚡. استخدم المحرر المفضل لديك (Jupyter و VSCode و Pycharm) لتطوير تفاعلي ونشر ☁ بدون تغييرات رمز (Kubernetes و Airflow و AWS Batch و Slurm).
https://github.com/orchest/orchest إنشاء أنابيب بيانات ، الطريقة السهلة باستخدام واجهة المستخدم السهلة الاستخدام

تصور البيانات

https://github.com/gradio-app/gradio قم بإنشاء واجهة المستخدم لنموذج التعلم الآلي الخاص بك في Python في 3 دقائق. واجهة المستخدم عبارة عن تطبيق ويب يمكن مشاركته مع أي شخص ، وحتى الأشخاص غير الفنيين. واحدة من الميزات التي أحبها هي مكون الأمثلة. يوضح لك جيدًا أن هذا التطبيق مخصص لحالة استخدام التعلم الآلي.
https://github.com/streamlit/streamlit SPEREMLIT يحول البرامج النصية للبيانات إلى تطبيقات ويب قابلة للمشاركة في دقائق. كل شيء في بيثون. كل شيء مجانا. لا توجد خبرة في النهاية المطلوبة.
https://github.com/oegedijk/explainerdashboard تقوم بسرعة بإنشاء لوحات معلومات قابلة للتفسير والتي تعرض الأعمال الداخلية لنماذج التعلم الآلي "blackbox".
https://github.com/lux-org/lux ببساطة عن طريق طباعة DataFrame في دفتر Notebook Jupyter ، توصي Lux بمجموعة من المرئيات التي تبرز الاتجاهات والأنماط المثيرة للاهتمام في مجموعة البيانات.
https://github.com/slundberg/shap Shape (تفسيرات الإضافات Shapley) هو نهج نظري للعبة لشرح إخراج أي نموذج التعلم الآلي.
https://github.com/comet-ml/kangas kangas هي أداة لاستكشاف وتحليل وتصور بيانات الوسائط المتعددة واسعة النطاق. يوفر واجهة برمجة تطبيقات Python مباشرة لتسجيل جداول البيانات الكبيرة ، إلى جانب واجهة مرئية بديهية لأداء استعلامات معقدة مقابل مجموعة البيانات الخاصة بك.

ضبط الفائقة

قبل أن تبدأ ، يرجى قراءة منشور المدونة هذا لفهم دافع البحث بشكل عام: https://www.determined.ai/blog/stop-doing-iterative-model-development

افتح عينيك على التطوير الذي يحركه البحث. سوف يغيرك. الفائدة الرئيسية هي أنه لن يكون هناك انتكاسات. يسمح فقط بالتقدم والتحسين. تخيل العمل والتقدم كل يوم ، بدلاً من التراجع للخلف لأن الحل الجديد لا يعمل. هذا التقدم المضمون هو ما سيفعله التنمية التي يحركها البحث لك. ضعه على كل شيء في التحسين ، وليس فقط التعلم الآلي.

يتم تحديد تفضيلاتي العليا في الرأي ، وحن الشعاع ، و Optuna بسبب التوازي (ضبط موزع على العديد من الآلات) ، والمرونة (يمكن تحسين الأهداف التعسفية والسماح بضبط معلمات مجموعة البيانات) ، ومكتبة ASHA ، و ETC) ، والتحليل ، والتحليل.

https://github.com/determinated-ai/determined محدد عبارة عن منصة تدريب على التعلم العميق مفتوحة المصدر تجعل بناء نماذج سريعة وسهلة. IMO ، من الأفضل أن تضبط نسخًا باهظة الثمن في نماذج التعلم العميق لأنها ستدرب العديد من العصر على النماذج التي لها مقاييس واعدة ونماذج التوقف المبكرة التي لا تفعل ذلك. إنهم يدعمون AWS ومعظم الخدمات السحابية كمواطن من الدرجة الأولى. كما أنها تدعم الحالات الاستباقية ، وهي مرة أخرى ، رخيصة. عند الانتهاء من التدريب ، يتم إيقاف جميع مثيلات GPU تلقائيًا. إذا كنت ترغب في توفير المال على التدريب على نطاق واسع ، فانتقل مع العزم.
https://docs.ray.io/en/master/tune/index.html Ray Tune هي مكتبة Python لتنفيذ التجربة وضبط المتقلب على أي مقياس. إذا كنت تبحث عن ضبط موزع ، فمن المحتمل أن يكون Ray Tune هو الإطار الأكثر خطورة هناك.
https://github.com/optuna/optuna إطار برمجيات التحسين التلقائي للمعطر (إطار عمل لا يندري ، define-by-run)
https://github.com/pyhopper/pyhopper pyhopper هو مُحسِّن مفرط ، مصنوع خصيصًا للمشاكل ذات الأبعاد العالية الناشئة في أبحاث التعلم الآلي والشركات. ادعى هذا الرجل أنه أسرع 10x من Optuna. هل هذا الادعاء صحيح؟ لا يمكننا أن نعرف حتى نحاول!
https://github.com/keras-team/keras-tuner تحسينًا سهلاً للاستخدام ، وتوزيع الفائقة على keras ؛ اقرأ مقالها هنا
https://github.com/autonomio/talos التحسين hyperparameter لـ Keras و TensorFlow (tf.keras) و pytorch
https://github.com/maxpumperla/hyperas keras + hyperopt: غلاف بسيط للغاية لتحسين الفائقة المريحة
https://github.com/fmfn/bayesianoptimization تنفيذ Python للتحسين العالمي مع العمليات الغوسية.
https://github.com/hyperopt/hyperopt
https://github.com/msu-coinlab/pymoo التحسين متعدد الأهداف في بيثون
https://github.com/google/Vizier Open Source Vizier: تحسين صناديق سوداء موثوقة ومرنة. OSS Vizier هي خدمة تعتمد على Python لتحسين وبحوث Back-Box ، استنادًا إلى Google Vizier ، واحدة من أولى خدمات ضبط مقياس الفائقة المصممة للعمل على نطاق واسع.

السيارات

اجعل الآلات تتعلم بدون المهمة الشاقة المتمثلة في هندسة الميزات ، واختيار النماذج ، وضبط الفائقة التي يجب عليك القيام بها بنفسك. دع الآلات تؤدي التعلم الآلي لك!

شخصياً إذا كان لدي مجموعة بيانات جدولية ، فسأحاول Flaml و Mljar أولاً ، خاصة إذا كنت ترغب في الحصول على شيء يعمل بسرعة. إذا كنت ترغب في تجربة أطر عمل تعزيز التدرج مثل XgBoost و LightGBM و Catboost وما إلى ذلك ، لكنك لا تعرف أيها أفضل ، أقترح عليك تجربة السيارات أولاً لأنه سيحاول داخليًا أن تحاول تدرج الأطر المعززة المذكورة سابقًا.

أفضل أطر OpenSource Automl في عام 2021 مقالة عن متوسطة تحتوي على قائمة منسقة من أطر OpenSource Automl.
https://github.com/dabl/dabl تحليل بيانات خط الأساس ؛ قم بتدريب نموذج بسيط بسرعة لاستخدامه كخط أساس للأداء
https://www.automl.org/ العثور على قائمة منسقة من مكتبات السيارات والأبحاث
https://github.com/jhfjhfj1/autokeras اعتبارًا من الكتابة (24 أغسطس 2018) ، هذه المكتبة من السابق لأوانها لأنها لا تستطيع التصنيف إلا.
https://github.com/automl/auto-sklearn/ لا يتم تشغيل
https://github.com/epistasislab/tpot قم بتشغيل آلاف خطوط أنابيب التعلم الآلي وإخراج الرمز لك
https://github.com/climbsrocks/auto_ml اقرأ ما يفكر فيه المؤلف في المقارنة بين TPOT و Auto-sklearn
https://github.com/microsoft/flaml سريع وخفيف الوزن مع خوارزميات التحسين الاقتصادي التكلفة.
https://github.com/mljar/mljar-supervised حزمة بيثون التعلم الآلي الآلي تعمل مع بيانات جدولية. يعجبني أنه يولد تقرير التصور (في الوضع الشرح) والميزات الإضافية لك على سبيل المثال الميزات الذهبية وميزات K-Means.
https://github.com/awslabs/autogluon Automl للنص والصورة والبيانات الجدولية. لكنه لا يدعم Windows (اعتبارًا من 11 أكتوبر 2021).
https://github.com/autoviml/auto_viml تم تصميم Auto_viml لبناء نماذج قابلة للتفسير عالية الأداء مع أقل عدد من المتغيرات المطلوبة.

بنيات نموذجية

البنى التي هي حديثة في مجالها.

https://github.com/rwightman/pytorch-emage-models نماذج صور pytorch ، البرامج النصية ، الأوزان المسبقة-resnet ، Resnex ويسمى عادة timm .
https://modelzoo.co/ zoo model
https://github.com/tensorflow/models
أرجواني: توليد الموسيقى والفن مع ذكاء الآلة
https://github.com/phillipi/pix2pix ترجمة صورة إلى صورة باستخدام شبكات عدوانية مشروطة ؛ TensorFlow Port of PIX2PIX ؛ شاهد عرض هذا العمل: تعلم الرؤية بدون معلم
WAV2LETTER Facebook AI أبحاث أدوات التعرف على الكلام التلقائي
https://github.com/huggingface/transformers معالجة اللغة الطبيعية لـ tensorflow 2.0 و pytorch
https://github.com/huggingface/diffusers؟ الناشرون: نماذج نشر حديثة لتوليد الصور والصوت في Pytorch
https://bigscience.huggingface.co/blog/bloom افتح نموذج اللغة الكبيرة من BigScience LLM. شرط
https://github.com/hpcaitech/colossalai المقالة
https://stability.ai/blog/stable-diffusion-public-release الانتشار المستقر هو نموذج يمكنه إنشاء صور عالية الجودة من أوصاف نصية موجزة. فيما يلي خيط تويتر قصير يشرح سبب عمله بشكل جيد. وهنا موضوع يحتوي على موارد لمعرفة المزيد حول نماذج الانتشار.

الهندسة الفورية

نماذج اللغة الكبيرة (LLMS) مثل GPT-3 قوية ، ولكن يجب مطالبتها بإنشاء الإخراج المطلوب. هذا هو المكان الذي تأتي فيه الهندسة المهمة. الهندسة المطالبة هي عملية تصميم المطالبات التي يمكن استخدامها لإنشاء الإخراج المطلوب.

https://github.com/hwchase17/langchain إنها حزمة Python لبناء التطبيقات مع LLMs من خلال التكلفة.
https://dust.tt/ أداة قائمة على الويب لتصميم ونشر تطبيقات نموذج اللغة الكبيرة.
https://github.com/jerryjliu/gpt_index GPT INDEX هو مشروع يتكون من مجموعة من هياكل البيانات التي يتم إنشاؤها باستخدام LLMs ويمكن اجتيازها باستخدام LLMs للإجابة على الاستعلامات.
https://github.com/xpitfire/symbolicai/ مكتبة البرمجة التفافلية التكوينية: بناء التطبيقات مع LLMs في جوهرها من خلال واجهة برمجة التطبيقات الرمزية لدينا يعزز قوة البرمجة الكلاسيكية والتفاضلة في بيثون.

مدونات لطيفة ومدونات متابعة

https://www.pyimagesearch.com/ تم تحديث المدونة بشكل متكرر حول OpenCV والتعلم العميق
http://colah.github.io/ تفسيرات لطيفة مع تصورات جميلة
https://karpathy.github.io/ قام بتدريس بعض الدورات التدريبية على الشباك العميقة واستخدم العمل في تسلا كمدير منظمة العفو الدولية.
http://ruder.io Sebastian Ruder's Deep Learning and NLP Blog
http://www.wildml.com/
https://machinelearningmastery.com/ يحتوي على الكثير من المحتوى والموقع الجميل
قوائم التشغيل على YouTube الخاصة بـ Sirajology الكثير من مقدمة فرحان قصيرة كثيفة إلى ML
أوراق دقيقتين في قائمة تشغيل التعلم العميق
distill.pub وسيلة حديثة لتقديم البحوث في التعلم الآلي
Deeplearn.org شاشة التعلم العميق ؛ أخبار عن أوراق التعلم العميقة والتغريدات
مدونة Datarevenue حول MLOPs في الغالب
https://www.youtube.com/c/andrejkarpathy Andrej Karparthy ابتكر قناة YouTube جديدة بعد أن غادر فريق Autopilot Tesla لتعليم الناس كيفية تنفيذ الشبكات العصبية بأسلوب "الهجاء".
https://e2eml.school/blog.html مدونة Lead-to-Ende Machine التي تغطي الكثير من الموضوعات بالتفصيل على سبيل المثال كيف تعمل المحولات.
https://jalammar.github.io/ تصور التعلم الآلي مفهوم واحد في وقت واحد. تحتوي مدونته على تفسيرات مصورة لمفاهيم ML مثل المحول أو الانتشار المستقر.
مدونة Radek Osmulski هو المدونات حول تقنيات DL والاستراتيجيات التي يمكنك الاستفادة منها للتعلم بشكل أسرع.

الناس المؤثرون

جيفري هينتون ، أطلق عليه اسم عراب التعلم العميق من خلال تقديم تقنيات ثورة في ثورة (RELU والمتسربين) مع طلابه. هذه التقنيات تحل مشكلة التدرج والتعميم للشبكات العصبية العميقة.
Yann Lecun ، اخترع CNNs (الشبكات العصبية التلافيفية) ، وهو نوع الشبكة التي تحظى بشعبية كبيرة بين مطوري رؤية الكمبيوتر اليوم. يعمل حاليًا في META.
Yoshua Bengio another serious professor at Deep Learning, you can watch his TEDx talk here (2017)
Andrew Ng he discovered that GPUs make deep learning faster. He taught 2 famous online courses, Machine Learning and Deep Learning specialization at Coursera. particular type of RNN)
Jeff Dean, a Google Brain engineer, watch his TEDx Talk
Ian Goodfellow, he invented GANs (Generative Adversarial Networks), is an OpenAI engineer
David Silver this is the guy behind AlphaGo and Artari reinforcement learning game agents at DeepMind
Demis Hassabis CEO of DeepMind, has given a lot of talks about AlphaGo and Reinforcement Learning achievements they have
Andrej Karparthy he teaches convnet classes, wrote ConvNetJS, and produces a lot of content for DL community, he also writes a blog (see Nice Blogs & Vlogs to Follow section)
Pedro Domingos he wrote the book The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World , watch his TEDx talk here
Emad Mostaque he is the founder of stability.ai, a company that releases many open source AI models including Stable Diffusion
Sam Altman he is the president of OpenAI, a company that releases ChatGPT

Cutting-Edge Research Publishers

Steal the most recent techniques introduced by smart computer scientists (could be you).

http://www.arxiv-sanity.com/ Arxiv Sanity Preserver
https://research.facebook.com/ai/
http://research.google.com/pubs/MachineIntelligence.html
https://deepmind.com/research/ Research of DeepMind company
https://www.openai.com/
https://www.openai.com/requests-for-research/
State of the art performance on each ML task
State-of-the-art result for all Machine Learning Problems
https://stability.ai/ is releasing a lot of open source high-quality models.
https://twitter.com/ai__pub AI papers and AI research explained, for technical people.
https://twitter.com/_akhaliq is a Twitter account that tweets the latest research papers in the field of AI.

Practitioner Community

https://www.kaggle.com
https://gym.openai.com
https://universe.openai.com/
/r/MachineLearning
https://www.facebook.com/groups/DeepNetGroup/

Thoughtful Insights for Future Research

Why AI is Harder Than We Think
The Consciousness Prior by Yoshua Bengio
What Can't Deep Learning Do? a list of problems that deep learning faces
Pedro Domingos: "The Master Algorithm" - Talks at Google
The AI Revolution: The Road to Superintelligence
https://ai100.stanford.edu/2016-report
Why does Deep Learning work so well? - The Extraordinary Link Between Deep Neural Networks and the Nature of the Universe
These are three of the biggest problems facing today's AI
Four Questions For: Geoff Hinton Geoff Hinton is referred to as "godfather of neural networks"
What product breakthroughs will recent advances in deep learning enable? - Quora
Liquid Neural Networks

غير مصنف

Artificial Intelligence: A Modern Approach (Online Book)
The Principles of Modern Game AI
Scipy Lecture Notes
https://www.youtube.com/user/aicourses
The Fundamentals of Neuroscience learn how our brain works so that you can discover new deep learning breakthrough
Bayesian Methods for Hackers An introduction to Bayesian methods + probabilistic programming with a computation/understanding-first, mathematics-second point of view. All in pure Python ;)

Other Big Lists

https://github.com/ahmedbahaaeldin/From-0-to-Research-Scientist-resources-guide This guide is designated to anybody with basic programming knowledge or a computer science background interested in becoming a Research Scientist with on Deep Learning and NLP.
https://www.mrdbourke.com/ml-resources/ Machine Learning Courses & Resources recommendation by Daniel Bourke
List of MLOps Courses and Books by Damien Benveniste on Facebook
https://github.com/collections/machine-learning
https://github.com/topics/machine-learning
https://github.com/topics/mlops
https://github.com/GokuMohandas/MadeWithML Join 30K+ developers in learning how to responsibly deliver value with ML.
https://papers.labml.ai/papers/daily
https://github.com/alirezadir/Production-Level-Deep-Learning
https://github.com/jindongwang/transferlearning
https://github.com/kmario23/deep-learning-drizzle
https://github.com/ZuzooVn/machine-learning-for-software-engineers
https://github.com/josephmisiti/awesome-machine-learning
https://github.com/ujjwalkarn/Machine-Learning-Tutorials
https://github.com/terryum/awesome-deep-learning-papers
https://github.com/ChristosChristofidis/awesome-deep-learning
https://github.com/Developer-Y/cs-video-courses#machine-learning
Deep Learning Resources by Jeremy D. Jackson
https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadmap
https://github.com/aikorea/awesome-rl Awesome Reinforcement Learning
https://github.com/artix41/awesome-transfer-learning Awesome Transfer Learning
https://github.com/heejkoo/Awesome-Diffusion-Models Awesome Diffusion Models
https://github.com/Renumics/awesome-open-data-centric-ai Data-centric AI is the practice of systematically engineering the data used to build AI systems.
https://github.com/labmlai/annotated_deep_learning_paper_implementations
https://github.com/ashishpatel26/500-AI-Machine-learning-Deep-learning-Computer-vision-NLP-Projects-with-code

I am confused, too many links, where do I start?

If you are a beginner and want to get started with my suggestions, please read this issue: #4

تنصل

From now on, this list is going to be compact and opinionated towards my own real-world ML journey and I will put only content that I think are truly beneficial for me and most people. All the materials and tools that are not good enough (in any aspect) will be gradually removed to combat information overload, including:

too difficult materials without much intuition; impractical content
too much theory without real-world practice
low-quality and unstructured materials
courses that I don't consider to enroll myself
knowledge or tools that are too niche and not many people can use it in their works eg deepdream or unsupervised domain adaptation (because you can Google it if you want to use it in your work).
tools that are beaten by other tools; not being state-of-the-art anymore
commercial tools that look like it can die any time soon
projects that are outdated or not maintained anymore

NOTE : There is no particular rank for each link. The order in which they appear does not convey any meaning and should not be treated differently.