Hello there. I am Shanmukha Sainath, working as AI Engineer at KLA Corporation. I have done my Bachelors from Department of Electronics and Electrical Communication Engineering department, IIT Kharagpur.
互联网世界是巨大的,是学习任何新事物的资源。有许多免费的免费资源来学习机器学习。有很多选择的选择,很难选择最佳选择(从经验中说)。因此,我收集了最佳资源,以开始机器学习并继续在该领域的职业。
欢迎反馈和建议:)
MIT的18.06线性代数课程是学习线性代数基础知识的最佳课程
可汗学院的矩阵课程是学习矩阵代数的基础知识的最佳课程
可汗学院的统计和概率课程是最好的课程。
微积分是学习微积分基础知识的最佳课程。
6.006对算法的插图是麻省理工学院学习数据结构和算法的基础知识的课程。
Python教程是学习Python基本语法的最佳场所。
但是,我正在为某些图书馆分享其他资源,以快速学习它们。每当您遇到某种功能或实现时。始终最好参考官方网站中存在的documentation / tutorials / code 。
Numpy是一个可以在Python中启用Numerical Computing库。在机器学习中,我们总是与阵列一起工作。 Numpy使用可用的大量功能有助于操作这些数组。
Pandas是一种快速,强大,灵活且易于使用的开源数据分析和操纵工具,该工具构建在Python编程语言之上。要了解有关使用和熊猫的优势的更多信息,请访问包概述页面
这将有助于适应熊猫的一些频繁操作。OpenCV-Python是旨在解决计算机视觉问题的Python绑定库。 OpenCV-Python是原始OpenCV C ++实现的Python包装器。
有关更多详细信息和实施,请参阅官方教程。Python Imaging Library为Python解释器添加了图像处理功能。该库提供了广泛的文件格式支持,有效的内部表示以及相当强大的图像处理功能。
NLTK是构建Python程序以使用人类语言数据的领先平台。它提供了50多个语料库和词汇资源,例如WordNet,以及一套用于分类,令牌化,茎,标记,标记,解析和语义推理的文本处理功能,以及用于工业型NLP库的包装器
这将有助于习惯使用NLTK进行的一些频繁操作。Spacy是一个开源软件库,用于使用编程语言Python和Cython编写的高级自然语言处理。
Spacy的本课程有助于开始Spacy。Matplotlib是一个综合库,用于在Python中创建静态,动画和交互式可视化。
有关更多详细信息和实施,请参阅官方教程。Seaborn是基于Matplotlib的Python数据可视化库。它提供了一个高级界面,用于绘制有吸引力且内容丰富的统计图形。
有关更多详细信息和实施,请参阅官方教程。请参阅knoe的画廊,介绍Seaborn中存在的各种地块。Plotly的Python图形库制作交互式出版物质量图。如何制作线图,散点图,区域图,条形图,误差线,框图,直方图,热图,子图,多轴,极性图表和气泡图表的示例。
Scikit-Learn是用于Python编程语言的免费软件机器学习库。它具有各种classification , regression和clustering algorithms 。它的设计目的是与python数值和科学库Numpy and Scipy进行互操作。
Scikit-Learn和50个Scikit-Learn Tips的ML简介是Data School提供的最佳免费课程,以学习Scikit-Learn
Fastai是一个深度学习库,为从业者提供高级组件,可以快速,轻松地在标准深度学习域中提供最先进的结果,并为研究人员提供可混合并匹配以构建新方法的低级组件。查看页面以获取更多信息。
有关更多详细信息和实施,请参阅官方教程。Pytorch是一个由Meta开发的深度学习框架,可以通过用户友好的前端,分布式培训以及工具和库的生态系统实现快速,灵活的实验和有效的生产。
Tensorflow是由Google开发的深度学习框架。它是一个免费的开源软件库,用于机器学习和人工智能。它可以在一系列任务中使用,但特别关注深度神经网络的培训和推断。
Kaggle是最大的数据社区,可以在这里分享他们的作品,参与比赛,从免费课程中学习等等。
为了使更多的竞赛参与您感兴趣的任何竞争。竞赛分为3个Tabular , Computer Vision , NLP 。如果没有任何积极的竞赛尝试过去的竞争,那么您。如果您在任何时候都陷入困境,请参考讨论论坛中的公共可用笔记本 /帖子。 Kaggle上有许多可依赖的数据集。您还可以下载数据集并开始自己的项目
本网站包含跨各个平台的ML竞赛列表
Vetrivel PS撰写的此博客具有数据科学竞争平台的列表。
Papers with Code是一个免费开放的资源,具有机器学习论文,代码,数据集,方法和评估表。
普华永道中的所有内容都分为类别,使得可以轻松获取特定的纸张。转到感兴趣的类别 /字段( Browse State-of-the-Art )。根据基准的数据集 /大多数实施 /库选择任何纸张。您还可以在各种框架中找到代码实现。
阅读论文。用您喜欢的框架实现算法/模型。用虚拟数据训练它进行检查。这是进入研究的最佳方法。
Andrej Karpathy
克里希纳克
与乔什·斯塔默(Josh Starmer)的Statquest
3Blue1brown
深度学习
Lex Fridman
Yannic Kilcher
亨利AI实验室
什么是AI
丹尼尔·伯克(Daniel Bourke)
张量
Deeplizard
阿拉丁·佩尔森(Aladdin Persson)
数字Sreeni
AI夏天
蒸馏
Google AI
meta ai
打开AI
AWS机器学习
Microsoft AI博客
lil'log
每周一次
Deepwizai
aman.ai
用代码的论文
arxiv
Arxiv理智
Scihub
Kaggle
用代码的论文
打开ML
CS231N:计算机视觉
CS224N:自然语言处理
CS224W:图形的机器学习
CS285:加固学习
LLM课程:编译资源以了解LLM
深度学习
Alpha信号:AI研究人员和工程师的每周消化
用代码的论文
什么是AI
Dair.ai的本周最高的ML论文
数据科学的每日剂量
该网站有所有可用的云GPU及其定价列表
Yannic Kilcher(不和谐)
cord.ai(松弛)
MLSpace:机器学习社区(Abhishek Thakur)(Discord)
权重与偏见:火车和微调模型,管理从实验到生产的模型
拥抱面:机器学习社区在模型,数据集和应用程序上合作的平台。
Pytorch Lightning:Pytorch Lightning是专业人工智能研究人员和机器学习工程师的深度学习框架,他们需要最大的灵活性,而无需大规模牺牲性能。
汽车图书馆:Pycaret,H2O Automl,Autokeras,FLAML
部署[初学者]:烧瓶,简化
Langchain:Langchain是一个框架,旨在简化使用大语言模型的应用程序创建。