
مستودع علوم البيانات مفتوح المصدر للتعلم والتطبيق نحو حل مشاكل العالم الحقيقي.
هذا مسار اختصار لبدء دراسة علم البيانات . ما عليك سوى اتباع الخطوات للإجابة على الأسئلة ، "ما هو علم البيانات وما الذي يجب أن أدرسه لتعلم علم البيانات؟"
| راعي | يقذف |
|---|---|
| --- | كن أول من رعاية! [email protected] |
^ back to top ^
تعتبر علوم البيانات واحدة من أهم الموضوعات في الأراضي الزراعية للكمبيوتر والإنترنت في الوقت الحاضر. قام الأشخاص بجمع البيانات من التطبيقات والأنظمة حتى اليوم والآن حان الوقت لتحليلها. تتمثل الخطوات التالية في تقديم اقتراحات من البيانات وإنشاء تنبؤات حول المستقبل. هنا يمكنك العثور على أكبر سؤال لعلوم البيانات ومئات الإجابات من الخبراء.
| وصلة | معاينة |
|---|---|
| ما هو علم البيانات @ O'Reilly | يجمع علماء البيانات بين ريادة الأعمال مع الصبر ، والرغبة في بناء منتجات البيانات بشكل تدريجي ، والقدرة على الاستكشاف ، والقدرة على التكرار على الحل. فهي متعددة التخصصات بطبيعتها. يمكنهم معالجة جميع جوانب المشكلة ، من جمع البيانات الأولي وتكييف البيانات إلى استخلاص الاستنتاجات. يمكن أن يفكروا خارج الصندوق للتوصل إلى طرق جديدة لعرض المشكلة ، أو العمل مع مشاكل محددة على نطاق واسع: "إليك الكثير من البيانات ، ما الذي يمكنك صنعه منها؟" |
| ما هو علم البيانات @ Quora | علوم البيانات هي مزيج من عدد من جوانب البيانات مثل التكنولوجيا وتطوير الخوارزمية وتداخل البيانات لدراسة البيانات وتحليلها وإيجاد حلول مبتكرة للمشاكل الصعبة. في الأساس ، يتعلق علم البيانات بتحليل البيانات والقيادة لنمو الأعمال من خلال إيجاد طرق مبتكرة. |
| الوظيفة الأكثر جاذبية في القرن الحادي والعشرين | يشبه علماء البيانات اليوم "Quants" في وول ستريت في الثمانينيات والتسعينيات. في تلك الأيام ، تم بث الأشخاص الذين يعانون من خلفيات في الفيزياء والرياضيات إلى البنوك الاستثمارية وصناديق التحوط ، حيث يمكنهم وضع خوارزميات واستراتيجيات البيانات الجديدة تمامًا. بعد ذلك ، طورت مجموعة متنوعة من الجامعات برامج الماجستير في الهندسة المالية ، والتي خرجت من الجيل الثاني من المواهب التي كانت في متناول الشركات السائدة. تم تكرار هذا النمط في وقت لاحق من التسعينيات مع مهندسي البحث ، الذين سرعان ما تم تدريس مهاراتهم النادرة في برامج علوم الكمبيوتر. |
| ويكيبيديا | علم البيانات هو مجال متعدد التخصصات يستخدم الأساليب والعمليات والخوارزميات والأنظمة العلمية لاستخراج المعرفة والرؤى من العديد من البيانات الهيكلية وغير المنظمة. يرتبط علم البيانات بتعدين البيانات والتعلم الآلي والبيانات الضخمة. |
| كيف تصبح عالم بيانات | علماء البيانات عبارة عن بيانات كبيرة من البيانات ، وجمع وتحليل مجموعات كبيرة من البيانات المنظمة وغير المنظمة. يجمع دور عالم البيانات بين علوم الكمبيوتر والإحصاء والرياضيات. يقومون بتحليل البيانات ومعالجتها ونموذجها ثم يفسرون النتائج لإنشاء خطط قابلة للتنفيذ للشركات والمؤسسات الأخرى. |
| تاريخ قصير جدا من #Datascience | إن قصة كيف أصبح علماء البيانات مثيرًا في الغالب قصة اقتران الانضباط الناضج للإحصاءات مع علم شاب للغاية-العلم الحامل. ظهر مصطلح "علم البيانات" مؤخرًا فقط لتعيين مهنة جديدة من المتوقع أن يفهم المتاجر الضخمة للبيانات الكبيرة. لكن فهم البيانات له تاريخ طويل وقد ناقشه العلماء والإحصائيون وأمناء المكتبات وعلماء الكمبيوتر وغيرهم لسنوات. يتتبع الجدول الزمني التالي تطور مصطلح "علم البيانات" واستخدامه ، ويحاول تحديده ، والمصطلحات ذات الصلة. |
| موارد تطوير البرمجيات لعلماء البيانات | يركز علماء البيانات على فهم البيانات من خلال التحليل الاستكشافي والإحصاءات والنماذج. يطبق مطورو البرمجيات مجموعة منفصلة من المعرفة بأدوات مختلفة. على الرغم من أن تركيزها قد يبدو غير ذي صلة ، إلا أن فرق علوم البيانات يمكن أن تستفيد من تبني أفضل الممارسات لتطوير البرمجيات. تساعد التحكم في الإصدار ، والاختبار الآلي ، ومهارات DEV الأخرى على إنشاء رمز وأدوات جاهزة للإنتاج. |
| خريطة طريق عالم البيانات | تعتبر علوم البيانات اختيارًا مهنيًا ممتازًا في عالم اليوم الذي يعتمد على البيانات حيث يتم إنشاء حوالي 328.77 مليون من البيانات من البيانات يوميًا. وهذا الرقم يزداد يومًا بعد يوم فقط ، مما يزيد بدوره من الطلب على علماء البيانات الماهرة الذين يمكنهم استخدام هذه البيانات لدفع نمو الأعمال. |
| التنقل في طريقك لتصبح عالم بيانات | _data Science هي واحدة من أكثر المهن طلبًا اليوم. مع تعتمد الشركات بشكل متزايد على البيانات لاتخاذ القرارات ، نمت الحاجة إلى علماء البيانات الماهرة بسرعة. سواء كانت شركات التكنولوجيا أو منظمات الرعاية الصحية أو حتى المؤسسات الحكومية ، تلعب علماء البيانات دورًا مهمًا في تحويل البيانات الأولية إلى رؤى قيمة. ولكن كيف تصبح عالم بيانات ، خاصة إذا كنت قد بدأت للتو؟ _ |
^ back to top ^
على الرغم من أنه ليس ضروريًا تمامًا ، إلا أن وجود لغة برمجة يعد مهارة حاسمة لتكون فعالة كعالم بيانات. حاليا ، اللغة الأكثر شعبية هي بيثون ، تليها عن كثب ص . Python هي لغة برمجة للأغراض العامة التي ترى التطبيقات في مجموعة واسعة من الحقول. R هي لغة خاصة بالمجال للإحصاءات ، والتي تحتوي على الكثير من أدوات الإحصاءات الشائعة خارج المربع.
تعد Python اللغة الأكثر شعبية في العلوم ، ويرجع ذلك إلى حد ما إلى السهولة التي يمكن استخدامها والنظام الإيكولوجي النابض بالحياة للحزم التي تم إنشاؤها بواسطة المستخدمين. لتثبيت الحزم ، هناك طريقتان رئيسيتان: PIP (تم استدعاؤه pip install ) ، ومدير الحزمة الذي يأتي مع Python ، و Anaconda (تم استدعاؤه كإجراء conda install ) ، وهو مدير حزمة قوي يمكنه تثبيت حزم للبيثون ، R ، ويمكن تنزيلها مثل GIT.
على عكس R ، لم يتم بناء Python من الألف إلى الياء مع مراعاة علم البيانات ، ولكن هناك الكثير من مكتبات الجهات الخارجية للتعويض عن هذا. يمكن العثور على قائمة أكثر شمولية من الحزم لاحقًا في هذا المستند ، ولكن هذه الحزم الأربعة هي مجموعة جيدة من الخيارات لبدء رحلة علمية البيانات الخاصة بك مع: Scikit-Learn هي حزمة علم بيانات للأغراض العامة التي تنفذ الخوارزميات الأكثر شعبية-ويشمل أيضًا وثائق غنية ، ودروس ، وأمثلة على النماذج التي تنفذها. حتى إذا كنت تفضل كتابة تطبيقاتك الخاصة ، فإن Scikit-Learn هو إشارة قيمة إلى المكسرات والبراغي وراء العديد من الخوارزميات الشائعة التي ستجدها. مع الباندا ، يمكن للمرء جمع بياناته وتحليلها في تنسيق جدول مناسب. يوفر Numpy أدوات سريعة للغاية للعمليات الرياضية ، مع التركيز على المتجهات والمصفوفات. تعد Seaborn ، التي تستند إلى حزمة Matplotlib ، طريقة سريعة لتوليد تصورات جميلة لبياناتك ، مع وجود العديد من الافتراضات الجيدة المتوفرة خارج المربع ، بالإضافة إلى معرض يوضح كيفية إنتاج العديد من التصورات الشائعة لبياناتك.
عند الشروع في رحلتك لتصبح عالم بيانات ، فإن اختيار اللغة ليس بالأهمية بشكل خاص ، ويمتلك كل من Python و R إيجابياتهم وسلبياتهم. اختر لغة تحبها ، وتحقق من إحدى الدورات المجانية التي أدرجناها أدناه!
^ back to top ^
علم البيانات هو أداة قوية يتم استخدامها في مختلف المجالات لحل مشاكل العالم الحقيقي عن طريق استخراج رؤى وأنماط من البيانات المعقدة.
^ back to top ^
^ back to top ^
كيف تتعلم علم البيانات؟ من خلال القيام بعلم البيانات ، بالطبع! حسنًا ، حسنًا - قد لا يكون ذلك مفيدًا بشكل خاص عندما تبدأ لأول مرة. في هذا القسم ، أدرجنا بعض موارد التعلم ، بترتيب تقريبي من أقل التزامًا - دروسًا ، ودورات مفتوحة على الإنترنت (MOOCs) ، والبرامج المكثفة ، والكليات.
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
هذا القسم عبارة عن مجموعة من الحزم والأدوات والخوارزميات وغيرها من العناصر المفيدة في عالم علوم البيانات.
^ back to top ^
هذه هي بعض خوارزميات ونماذج التعلم الآلي والبيانات تساعدك على فهم بياناتك واشتقاق المعنى منها.
^ back to top ^
^ back to top ^
^ back to top ^
| وصلة | وصف |
|---|---|
| عملية دورة حياة علم البيانات | عملية دورة حياة علوم البيانات هي عملية لأخذ فرق علوم البيانات من الفكرة إلى القيمة بشكل متكرر ومستدام. تم توثيق العملية في هذا الريبو |
| قالب دورة حياة علم البيانات ريبو | مستودع قوالب لمشروع دورة حياة علوم البيانات |
| Rexmex | مكتبة مقاييس موصية للأغراض العامة للتقييم العادل. |
| Chemicalx | مكتبة التعلم العميق القائمة على Pytorch لتسجيل زوج المخدرات. |
| Pytorch الهندسة الزمنية | تمثيل التعلم على الرسوم البيانية الديناميكية. |
| كرة صغيرة من الفراء | مكتبة أخذ عينات الرسم البياني لشبكة NetworkX مع Scikit-Learn مثل API. |
| نادي الكاراتيه | مكتبة تمديد للتعلم الآلي غير خاضعة للإشراف لشبكة NetworkX مع تعليمي Scikit مثل API. |
| مساحة العمل ML | الكل في واحد IDE القائم على الويب للتعلم الآلي وعلوم البيانات. يتم نشر مساحة العمل كحاوية مرسى ويتم تحميلها مسبقًا مع مجموعة متنوعة من مكتبات علوم البيانات الشائعة (على سبيل المثال ، TensorFlow ، Pytorch) وأدوات DEV (على سبيل المثال ، Jupyter ، VS Code) |
| نبتون | منصة صديقة للمجتمع تدعم علماء البيانات في إنشاء نماذج التعلم الآلي ومشاركتها. يسهل نبتون العمل الجماعي وإدارة البنية التحتية ومقارنة النماذج والاستنساخ. |
| السهوب | مكتبة بيثون خفيفة الوزن لتجربة التعلم الآلي السريع والقابل للتكرار. يقدم واجهة بسيطة للغاية تتيح تصميم خط أنابيب التعلم الآلي النظيفة. |
| السهوب تولكيت | مجموعة برعاية من الشبكات العصبية والمحولات والنماذج التي تجعل العمل التعلم الآلي الخاص بك أسرع وأكثر فاعلية. |
| Datalab من Google | استكشاف البيانات وتصورها وتحليلها وتحويلها بسهولة باستخدام لغات مألوفة ، مثل Python و SQL ، بشكل تفاعلي. |
| Hortonworks Sandbox | هي بيئة Hadoop شخصية ومحمولة تأتي مع عشرات البرامج التعليمية التفاعلية Hadoop. |
| ص | هي بيئة برمجيات مجانية للحوسبة الإحصائية والرسومات. |
| ترتيب | هي مجموعة من الحزم R المصممة لعلوم البيانات. تشترك جميع الحزم في فلسفة التصميم الأساسية ، والقواعد ، وهياكل البيانات. |
| rstudio | IDE - واجهة مستخدم قوية لـ R. إنها مجانية ومفتوحة المصدر ، وتعمل على Windows و Mac و Linux. |
| بيثون - باندا - أناكوندا | توزيع بيثون جاهز تمامًا للمؤسسات لمعالجة البيانات على نطاق واسع ، والتحليلات التنبؤية ، والحوسبة العلمية |
| Pandas GUI | Pandas GUI |
| Scikit-Learn | التعلم الآلي في بيثون |
| numpy | Numpy أمر أساسي للحوسبة العلمية مع Python. وهو يدعم المصفوفات والمصفوفات الكبيرة متعددة الأبعاد ويتضمن مجموعة متنوعة من الوظائف الرياضية عالية المستوى للعمل في هذه المصفوفات. |
| VAEX | VAEX هي مكتبة Python تتيح لك تصور مجموعات بيانات كبيرة وحساب الإحصائيات بسرعات عالية. |
| سكيبي | يعمل Scipy مع صفائف Numpy ويوفر إجراءات فعالة للتكامل العددي والتحسين. |
| أدوات علوم البيانات | دورة Coursera |
| أدوات علوم البيانات | مدونة |
| منصة علوم بيانات Wolfram | خذ عداديًا أو نصيًا أو صورة أو نظم المعلومات الجغرافية أو غيرها من البيانات وأعطيه علاج Wolfram ، مما يؤدي إلى مجموعة كاملة من تحليل وتصور علوم البيانات وتوليد تقارير تفاعلية غنية تلقائيًا-وكلها مدعومة بلغة Wolfram الثورية القائمة على المعرفة. |
| datadog | الحلول ، الكود ، و devops لعلوم البيانات عالية النطاق. |
| التباين | قم ببناء تصورات بيانات قوية للويب دون كتابة JavaScript |
| طقم تطوير طائرة ورقية | مجموعة Kite Software Development (ترخيص Apache ، الإصدار 2.0) ، أو Kite for Short ، هي مجموعة من المكتبات والأدوات والأمثلة والوثائق التي تركز على تسهيل بناء الأنظمة أعلى نظام Hadoop البيئي. |
| مختبرات Domino Data | قم بتشغيل النماذج الخاصة بك ، وتوسيع نطاقها ، ونشرها - دون أي بنية تحتية أو إعداد. |
| Apache Flink | منصة لمعالجة البيانات الفعالة والموزعة والموزع. |
| أباتشي هاما | Apache Hama هو مشروع مفتوح المصدر من Apache ، مما يتيح لك إجراء تحليلات متقدمة خارج MapReduce. |
| ويكا | Weka هي مجموعة من خوارزميات التعلم الآلي لمهام تعدين البيانات. |
| أوكتاف | Gnu Octave هي لغة تفسير عالية المستوى ، مخصصة في المقام الأول للحسابات العددية. (Matlab الحرة) |
| أباتشي سبارك | حوسبة الكتلة السريعة البرق |
| ضباب مائي | خدمة لتعريض وظائف Apache Spark Analytics ونماذج التعلم الآلي كخدمات ويب في الوقت الفعلي أو الدُفعة أو التفاعلية. |
| ميكانيكا البيانات | منصة علم البيانات والهندسة التي تجعل Apache Spark أكثر ملاءمة للمطورين وفعالة من حيث التكلفة. |
| الكافيين | إطار التعلم العميق |
| الشعلة | إطار حوسبة علمية لويجيت |
| إطار التعلم العميق القائم على بيثون فيليانا | إطار التعلم العميق في Intel® Nervana ™ ملتزم بأفضل أداء على جميع الأجهزة. |
| سكال | معالجة البيانات الموزعة عالية الأداء في nodejs |
| Aerosolve | حزمة التعلم الآلي بنيت للبشر. |
| إطار Intel | إطار التعلم العميق Intel® |
| datawrapper | منصة تصور البيانات مفتوحة المصدر تساعد الجميع على إنشاء مخططات بسيطة وصحيحة ومتضمنة. أيضا في github.com |
| تدفق الموتر | TensorFlow هي مكتبة برامج مفتوحة المصدر لذكاء الآلة |
| مجموعة أدوات اللغة الطبيعية | مجموعة أدوات تمهيدية وقوية لمعالجة اللغة الطبيعية وتصنيفها |
| مختبر التعليقات التوضيحية | منصة خالية من الرمز من طرف إلى طرف لشرح النصوص النصية وتوليف نموذج DL. الدعم خارج الصندوق للتعرف على الكيان المسماة والتصنيف واستخراج العلاقة ونماذج حالة التأكيد تشرف نماذج NLP. دعم غير محدود للمستخدمين والفرق والمشاريع والمستندات. |
| NLP-Toolkit لـ Node.js | تغطي هذه الوحدة بعض مبادئ وتطبيقات NLP الأساسية. التركيز الرئيسي هو الأداء. عندما نتعامل مع نموذج أو تدريب بيانات في NLP ، نفد بسرعة من الذاكرة. لذلك ، يتم كتابة كل تطبيق في هذه الوحدة على أنه دفق للاحتفاظ فقط بالبيانات في الذاكرة التي تتم معالجتها حاليًا في أي خطوة. |
| جوليا | لغة برمجة ديناميكية عالية المستوى وعالية الأداء للحوسبة الفنية |
| إيجوليا | خلفية باللغة جوليا مع البيئة التفاعلية Jupyter |
| أباتشي زيبلين | دفتر ملاحظات قائم على الويب والذي يمكّن تحليلات البيانات التفاعلية والمستندات التعاونية مع SQL و Scala والمزيد |
| ميزة | إطار مفتوح المصدر لهندسة الميزات الآلية المكتوبة في بيثون |
| Optimus | التطهير ، والمعالجة المسبقة ، وهندسة الميزات ، وتحليل البيانات الاستكشافية و ML السهل مع الواجهة الخلفية Pyspark. |
| الحوابع البيضاء | حول مكتبة تكبير الصور السريعة والإطار التي تنفذ مجموعة متنوعة من تقنيات التعزيز. يدعم التصنيف والتجزئة والاكتشاف خارج الصندوق. تم استخدامه للفوز بعدد من مسابقات التعلم العميق في Kaggle و TopCoder وتلك التي كانت جزءًا من ورش عمل CVPR. |
| DVC | نظام التحكم في إصدار بيانات علوم البيانات مفتوح المصدر. يساعد في تتبع وتنظيم وجعل مشاريع علوم البيانات قابلة للتكرار. في السيناريو الأساسي للغاية ، يساعد الإصدار على التحكم ومشاركة ملفات البيانات والموديل الكبيرة. |
| لامدو | هو محرك سير العمل الذي يبسط بشكل كبير تحليل البيانات من خلال الجمع بين خط أنابيب تحليل واحد (I) هندسة الميزات والتعلم الآلي (II) تدريب النماذج والتنبؤ (III) تقييم الجدول وتقييم الأعمدة. |
| وليمة | متجر ميزات لإدارة ميزات التعلم الآلي واكتشافها والوصول إليها. يوفر Feast رؤية ثابتة لبيانات الميزات لكل من التدريب على النموذج وخدمة النموذج. |
| polyaxon | منصة للتعلم الآلي القابل للتكرار والقابل للتطوير والتعلم العميق. |
| Lighttag | أداة شرح نصية للفرق |
| أوبيا | أداة شرح نصية سهلة الاستخدام للفرق التي لديها أكثر ميزات التركيب التلقائي. يدعم NER والعلاقات وتصنيف المستند |
| القطارات | مدير التجربة السحرية التلقائية ، التحكم في الإصدار و DevOps من أجل الذكاء الاصطناعي |
| hopsworks | منصة التعلم الآلي المكثفة للبيانات مفتوحة المصدر مع متجر ميزات. استيعاب وإدارة الميزات لكل من الوصول عبر الإنترنت (MySQL Cluster) والوصول إلى غير متصل (Apache Hive) وتدريب النماذج وتقديمها على نطاق واسع. |
| Mindsdb | Mindsdb هو إطار عمل قابل للتفسير للمطورين. مع MindsDB ، يمكنك بناء وتدريب واستخدام نماذج ML على أحدث طرازات مثل سطر واحد من التعليمات البرمجية. |
| لايتوود | إطار عمل قائم على Pytorch يحطم مشاكل التعلم الآلي إلى كتل أصغر يمكن لصقها بسلاسة مع هدف بناء نماذج تنبؤية مع سطر واحد من التعليمات البرمجية. |
| AWS Data Wrangler | حزمة Python مفتوحة المصدر تمد قوة مكتبة Pandas إلى AWS التي توصل إلى إطارات البيانات والخدمات المتعلقة بالبيانات AWS (Amazon Redshift ، AWS Glue ، Amazon Athena ، Amazon EMR ، إلخ). |
| Amazon Rekognition | AWS Rekognition هي خدمة تتيح للمطورين الذين يعملون مع Amazon Web Services إضافة تحليل الصور إلى تطبيقاتهم. أصول الكتالوج ، أتمتة سير العمل ، واستخراج المعنى من الوسائط والتطبيقات الخاصة بك. |
| تكساس الأمازون | استخراج النص المطبوع تلقائيًا والكتابة اليدوية والبيانات من أي مستند. |
| Amazon Lookout عن الرؤية | عيوب المنتج بقعة باستخدام رؤية الكمبيوتر لأتمتة فحص الجودة. تحديد مكونات المنتج المفقودة ، وتلف المركبات والهيكل ، والمخالفات لمراقبة الجودة الشاملة. |
| Amazon Codeguru | أتمتة مراجعات التعليمات البرمجية وتحسين أداء التطبيق مع توصيات تعمل بالطاقة ML. |
| CML | مجموعة أدوات مفتوحة المصدر لاستخدام التكامل المستمر في مشاريع علوم البيانات. تدريب النماذج واختبارها تلقائيًا في بيئات تشبه الإنتاج مع إجراءات GitHub و Gitlab CI ، والتقارير المرئية التلقائية على طلبات السحب/الدمج. |
| داسك | مكتبة Python مفتوحة المصدر لنقل رمز التحليلات الخاص بك إلى أنظمة الحوسبة الموزعة (البيانات الضخمة) بشكل غير مؤلم إلى أنظمة الحوسبة الموزعة (البيانات الضخمة) |
| STATSMODELS | إحصاءات استنتاجية قائمة على الثعبان ، واختبار الفرضيات وإطار الانحدار |
| جينسيم | مكتبة مفتوحة المصدر لنمذجة موضوع اللغة الطبيعية |
| سبيس | مجموعة أدوات معالجة اللغة الطبيعية أداء |
| استوديو الشبكة | Grid Studio هو تطبيق جدول بيانات يعتمد على الويب مع تكامل كامل للغة برمجة Python. |
| كتيب علم بيانات بيثون | كتيب علم بيانات بيثون: النص الكامل في دفاتر Jupyter |
| شابلي | إطار عمل يعتمد على البيانات لقياس قيمة المصنفات في فرقة التعلم الآلي. |
| داجشوب | منصة مبنية على أدوات مفتوحة المصدر للبيانات والنموذج وخطوط الأنابيب. |
| عميق | نوع جديد من دفتر علوم البيانات. متوافق مع Jupyter ، مع التعاون في الوقت الفعلي وتشغيله في السحابة. |
| فالوهاي | منصة MLOPS التي تتعامل مع تزامن الماكينة ، والتكاثر التلقائي والنشر. |
| pymc3 | مكتبة بيثون للبرمجة الاحتمالية (الاستدلال البايزي والتعلم الآلي) |
| بيستان | واجهة بيثون إلى ستان (الاستدلال والنمذجة بايزي) |
| hmmlearn | التعلم غير الخاضع للإشراف واستنتاج نماذج ماركوف المخفية |
| عبقرية الفوضى | محرك التحليلات التي تعمل بالطاقة ML للكشف عن الأسباب الشاذة/الشذوذ وتحليل السبب الجذري |
| nimblebox | منصة MLOPs كاملة المكجمات المصممة لمساعدة علماء البيانات وممارسي التعلم الآلي في جميع أنحاء العالم على اكتشاف وإنشاء وتشغيل تطبيقات متعددة الصواريخ من متصفح الويب الخاص بهم. |
| towhee | مكتبة Python التي تساعدك على تشفير بياناتك غير المنظمة في تضمينات. |
| ليبي | هل سبق لي أن شعرت بالإحباط من تنظيف أجهزة الكمبيوتر المحمولة الطويلة الفوضوية؟ مع Lineapy ، مكتبة Python مفتوحة المصدر ، يستغرق الأمر أقل من سطرين من التعليمات البرمجية لتحويل رمز التطوير الفوضوي إلى خطوط أنابيب الإنتاج. |
| البيئة | ️ بيئة تطوير التعلم الآلي لعلوم البيانات وفرق هندسة الذكاء الاصطناعي/مل |
| استكشاف مكتبات علوم البيانات | محرك بحث؟ أداة لاكتشاف وإيجاد قائمة منسقة من المكتبات الشهيرة والجديدة ، وكبار المؤلفين ، وأدوات المشاريع ، والمناقشات ، والدروس وموارد التعلم |
| ملم | ؟ الإصدار ونشر نماذج ML الخاصة بك بعد مبادئ GITOPS |
| mlflow | إطار عمل MLOPS لإدارة نماذج ML عبر دورة حياتهم الكاملة |
| CleanLab | مكتبة Python ل AI المتمحورة حول البيانات والاكتشاف تلقائيا المشكلات المختلفة في مجموعات بيانات ML |
| Autogluon | السيارات لإنتاج تنبؤات دقيقة للصورة والنص والجدولة والمواقع الزمنية والبيانات متعددة الوسائط |
| ARIZE AI | ARIZE AI AI Community Tier Assectiable Tool لمراقبة نماذج التعلم الآلي في مشكلات الإنتاج ومسبق الجذر مثل جودة البيانات وانجراف الأداء. |
| aureo.io | Aureo.io هي منصة منخفضة الرمز تركز على بناء الذكاء الاصطناعي. يوفر للمستخدمين القدرة على إنشاء خطوط أنابيب وأتمتة ودمجها مع نماذج الذكاء الاصطناعي - كل ذلك مع بياناتهم الأساسية. |
| مختبر ERD | أداة مخطط العلاقة الحرة القائمة على السحابة (ERD) المصنوعة للمطورين. |
| arize-phoenix | MLOPS في دفتر ملاحظات - كشف رؤى ، مشاكل السطح ، مراقبة ، وضبط النماذج الخاصة بك. |
| المذنب | منصة MLOPS مع تتبع التجربة ، وإدارة إنتاج النماذج ، وسجل النموذج ، ونسب البيانات الكاملة لدعم سير عمل ML الخاص بك من التدريب مباشرة إلى الإنتاج. |
| أوبيك | قم بتقييم واختبار وشحن تطبيقات LLM عبر دورات حياة DEV و Your Production. |
| سينثيكي | بيئة التعاونية التي تعمل بالنيابة عن الذكاء الاصطناعي للبحث. ابحث عن الأوراق ذات الصلة ، وإنشاء مجموعات لإدارة المراجع ، وتلخيص المحتوى - كل ذلك في مكان واحد |
| teeplot | أداة سير العمل لتنظيم إخراج تصور البيانات تلقائيًا |
| التدفق | إطار التطبيق للتعلم الآلي وعلوم البيانات |
| غراد | إنشاء مكونات واجهة المستخدم القابلة للتخصيص حول نماذج التعلم الآلي |
| الأوزان والتحيزات | تتبع التجربة ، وإصدار مجموعة البيانات ، وإدارة النماذج |
| DVC | نظام التحكم في الإصدار مفتوح المصدر لمشاريع التعلم الآلي |
| Optuna | إطار برامج التحسين التلقائي لفرط الأشرام |
| لحن راي | مكتبة ضبط مقياس فرط الأطراف القابلة للتطوير |
| Apache Airflow | منصة للمؤلف برمجيا ، الجدول الزمني ، ومراقبة سير العمل |
| المحافظ | نظام إدارة سير العمل لمكدس البيانات الحديثة |
| كيدو | إطار عمل بيثون مفتوح المصدر لإنشاء رمز علوم البيانات القابل للتكرار القابل للصيانة |
| هاميلتون | مكتبة خفيفة الوزن للمؤلف وإدارة تحويلات بيانات موثوقة |
| شكل | نهج نظرية اللعبة لشرح إخراج أي نموذج التعلم الآلي |
| الجير | شرح تنبؤات أي مصنف التعلم الآلي |
| فليتي | منصة أتمتة تدفق العمل للتعلم الآلي |
| DBT | أداة بناء البيانات |
| شكل | نهج نظرية اللعبة لشرح إخراج أي نموذج التعلم الآلي |
| الجير | شرح تنبؤات أي مصنف التعلم الآلي |
^ back to top ^
يتضمن هذا القسم بعض مواد القراءة الإضافية والقنوات التي يجب مشاهدتها والمحادثات للاستماع إليها.
^ back to top ^
eBook sale - Save up to 45% on eBooks!
Causal Machine Learning
Managing ML Projects
Causal Inference for Data Science
Data for All
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
Below are some Social Media links. Connect with other data scientists!
^ back to top ^
^ back to top ^
| تغريد | وصف |
|---|---|
| Big Data Combine | Rapid-fire, live tryouts for data scientists seeking to monetize their models as trading strategies |
| Big Data Mania | Data Viz Wiz, Data Journalist, Growth Hacker, Author of Data Science for Dummies (2015) |
| Big Data Science | Big Data, Data Science, Predictive Modeling, Business Analytics, Hadoop, Decision and Operations Research. |
| Charlie Greenbacker | Director of Data Science at @ExploreAltamira |
| Chris Said | Data scientist at Twitter |
| Clare Corthell | Dev, Design, Data Science @mattermark #hackerei |
| DADI Charles-Abner | #datascientist @Ekimetrics. , #machinelearning #dataviz #DynamicCharts #Hadoop #R #Python #NLP #Bitcoin #dataenthousiast |
| Data Science Central | Data Science Central is the industry's single resource for Big Data practitioners. |
| Data Science London | Data Science. Big Data. Data Hacks. Data Junkies. Data Startups. Open Data |
| Data Science Renee | Documenting my path from SQL Data Analyst pursuing an Engineering Master's Degree to Data Scientist |
| Data Science Report | Mission is to help guide & advance careers in Data Science & Analytics |
| Data Science Tips | Tips and Tricks for Data Scientists around the world! #datascience #bigdata |
| Data Vizzard | DataViz, Security, Military |
| DataScienceX | |
| deeplearning4j | |
| DJ Patil | White House Data Chief, VP @ RelateIQ. |
| Domino Data Lab | |
| Drew Conway | Data nerd, hacker, student of conflict. |
| Emilio Ferrara | #Networks, #MachineLearning and #DataScience. I work on #Social Media. Postdoc at @IndianaUniv |
| Erin Bartolo | Running with #BigData--enjoying a love/hate relationship with its hype. @iSchoolSU #DataScience Program Mgr. |
| Greg Reda | Working @ GrubHub about data and pandas |
| Gregory Piatetsky | KDnuggets President, Analytics/Big Data/Data Mining/Data Science expert, KDD & SIGKDD co-founder, was Chief Scientist at 2 startups, part-time philosopher. |
| Hadley Wickham | Chief Scientist at RStudio, and an Adjunct Professor of Statistics at the University of Auckland, Stanford University, and Rice University. |
| Hakan Kardas | عالم البيانات |
| Hilary Mason | Data Scientist in Residence at @accel. |
| Jeff Hammerbacher | ReTweeting about data science |
| John Myles White | Scientist at Facebook and Julia developer. Author of Machine Learning for Hackers and Bandit Algorithms for Website Optimization. Tweets reflect my views only. |
| Juan Miguel Lavista | Principal Data Scientist @ Microsoft Data Science Team |
| Julia Evans | Hacker - Pandas - Data Analyze |
| Kenneth Cukier | The Economist's Data Editor and co-author of Big Data (http://www.big-data-book.com/). |
| Kevin Davenport | Organizer of https://www.meetup.com/San-Diego-Data-Science-R-Users-Group/ |
| Kevin Markham | Data science instructor, and founder of Data School |
| Kim Rees | Interactive data visualization and tools. Data flaneur. |
| Kirk Borne | DataScientist, PhD Astrophysicist, Top #BigData Influencer. |
| Linda Regber | Data storyteller, visualizations. |
| Luis Rei | PhD Student. Programming, Mobile, Web. Artificial Intelligence, Intelligent Robotics Machine Learning, Data Mining, Natural Language Processing, Data Science. |
| Mark Stevenson | Data Analytics Recruitment Specialist at Salt (@SaltJobs) Analytics - Insight - Big Data - Data science |
| Matt Harrison | Opinions of full-stack Python guy, author, instructor, currently playing Data Scientist. Occasional fathering, husbanding, organic gardening. |
| Matthew Russell | Mining the Social Web. |
| Mert Nuhoğlu | Data Scientist at BizQualify, Developer |
| Monica Rogati | Data @ Jawbone. Turned data into stories & products at LinkedIn. Text mining, applied machine learning, recommender systems. Ex-gamer, ex-machine coder; namer. |
| Noah Iliinsky | Visualization & interaction designer. Practical cyclist. Author of vis books: https://www.oreilly.com/pub/au/4419 |
| Paul Miller | Cloud Computing/ Big Data/ Open Data Analyst & Consultant. Writer, Speaker & Moderator. Gigaom Research Analyst. |
| Peter Skomoroch | Creating intelligent systems to automate tasks & improve decisions. Entrepreneur, ex-Principal Data Scientist @LinkedIn. Machine Learning, ProductRei, Networks |
| Prash Chan | Solution Architect @ IBM, Master Data Management, Data Quality & Data Governance Blogger. Data Science, Hadoop, Big Data & Cloud. |
| Quora Data Science | Quora's data science topic |
| R-Bloggers | Tweet blog posts from the R blogosphere, data science conferences, and (!) open jobs for data scientists. |
| Rand Hindi | |
| Randy Olson | Computer scientist researching artificial intelligence. Data tinkerer. Community leader for @DataIsBeautiful. #OpenScience advocate. |
| Recep Erol | Data Science geek @ UALR |
| Ryan Orban | Data scientist, genetic origamist, hardware aficionado |
| Sean J. Taylor | Social Scientist. Hacker. Facebook Data Science Team. Keywords: Experiments, Causal Inference, Statistics, Machine Learning, Economics. |
| Silvia K. Spiva | #DataScience at Cisco |
| Harsh B. Gupta | Data Scientist at BBVA Compass |
| Spencer Nelson | Data nerd |
| Talha Oz | Enjoys ABM, SNA, DM, ML, NLP, HI, Python, Java. Top percentile Kaggler/data scientist |
| Tasos Skarlatidis | Complex Event Processing, Big Data, Artificial Intelligence and Machine Learning. Passionate about programming and open-source. |
| Terry Timko | InfoGov; Bigdata; Data as a Service; Data Science; Open, Social & Business Data Convergence |
| Tony Baer | IT analyst with Ovum covering Big Data & data management with some systems engineering thrown in. |
| Tony Ojeda | Data Scientist , Author , Entrepreneur. Co-founder @DataCommunityDC. Founder @DistrictDataLab. #DataScience #BigData #DataDC |
| Vamshi Ambati | Data Science @ PayPal. #NLP, #machinelearning; PhD, Carnegie Mellon alumni (Blog: https://allthingsds.wordpress.com ) |
| Wes McKinney | Pandas (Python Data Analysis library). |
| WileyEd | Senior Manager - @Seagate Big Data Analytics @McKinsey Alum #BigData + #Analytics Evangelist #Hadoop, #Cloud, #Digital, & #R Enthusiast |
| WNYC Data News Team | The data news crew at @WNYC. Practicing data-driven journalism, making it visual, and showing our work. |
| Alexey Grigorev | Data science author |
| İlker Arslan | Data science author. Shares mostly about Julia programming |
| حتمي | AI & Data Science Start-up Company based in England, UK |
^ back to top ^
قمة
Some data mining competition platforms
^ back to top ^
| معاينة | وصف |
|---|---|
| Key differences of a data scientist vs. data engineer | |
| A visual guide to Becoming a Data Scientist in 8 Steps by DataCamp (img) | |
| Mindmap on required skills (img) | |
| Swami Chandrasekaran made a Curriculum via Metro map. | |
| by @kzawadz via twitter | |
| By Data Science Central | |
| Data Science Wars: R vs Python | |
| How to select statistical or machine learning techniques | |
| Choosing the Right Estimator | |
| The Data Science Industry: Who Does What | |
| Data Science | |
| Different Data Science Skills and Roles from this article by Springboard | |
| A simple and friendly way of teaching your non-data scientist/non-statistician colleagues how to avoid mistakes with data. From Geckoboard's Data Literacy Lessons. |
^ back to top ^
^ back to top ^