Hello there. I am Shanmukha Sainath, working as AI Engineer at KLA Corporation. I have done my Bachelors from Department of Electronics and Electrical Communication Engineering department, IIT Kharagpur.
Le monde Internet est énorme, ainsi que des ressources pour apprendre de nouvelles choses. Il existe de nombreuses ressources gratuites et payantes pour apprendre l'apprentissage automatique. Avoir de nombreuses options à la main confond et il est difficile de sélectionner le meilleur (disant par expérience). J'ai donc collecté les meilleures ressources pour commencer avec l'apprentissage automatique et continuer la carrière dans ce domaine.
Les commentaires et les suggestions sont les bienvenus :)
18.06 Le cours d'algèbre linéaire par le MIT est le meilleur cours pour apprendre les bases de l'algèbre linéaire
Cours de matrices par Khan Academy est le meilleur cours pour apprendre les bases de l'algèbre matricielle
Statistics and Probability Course par Khan Academy est le meilleur cours disponible.
Le calcul différentiel est le meilleur cours pour apprendre les bases du calcul différentiel.
6.006 L'intoduction aux algorithmes est le cours du MIT pour apprendre les bases des structures de données et des algorithmes.
Le tutoriel Python est le meilleur endroit pour apprendre la syntaxe de base de Python.
Mais je partage d'autres ressources pour que certaines bibliothèques les apprennent rapidement. Chaque fois que vous êtes coincé à une fonction ou à une implémentation. Il est toujours préférable de référer documentation / tutorials / code présents sur le site officiel.
Numpy est une bibliothèque qui permet Numerical Computing dans Python. Dans l'apprentissage automatique, nous travaillons toujours avec des tableaux. Numpy aide à utiliser ces tableaux en utilisant un grand nombre de fonctions disponibles.
Pandas est un outil d'analyse et de manipulation de données open source rapide, puissante, flexible et facile à utiliser, construit au-dessus du langage de programmation Python. Pour en savoir plus sur l'utilisation et les avantages de Pandas Visitez la page Présentation du forfait
Cela aidera à s'habituer à certaines opérations fréquentes effectuées avec des pandas.OpenCV-Python est une bibliothèque de liaisons Python conçues pour résoudre des problèmes de vision par ordinateur. OpenCV-Python est un wrapper Python pour l'implémentation originale d'OpenCV C ++.
Reportez-vous aux tutoriels officiels pour plus de détails et de mise en œuvre. La Python Imaging Library ajoute des capacités de traitement d'image à l'interpréteur Python. Cette bibliothèque fournit une prise en charge approfondie du format de fichiers, une représentation interne efficace et des capacités de traitement d'image assez puissantes.
NLTK est une plate-forme de premier plan pour créer des programmes Python pour travailler avec les données du langage humain. Il fournit plus de 50 corpus et des ressources lexicales telles que WordNet, ainsi qu'une suite de fonctions de traitement de texte pour la classification, la tokenisation, la tige, le taggage, l'analyse et le raisonnement sémantique, les courtiers pour les bibliothèques NLP de force industrielle
Cela aidera à s'habituer à certaines opérations fréquentes effectuées avec NLTK.Spacy est une bibliothèque de logiciels open source pour le traitement avancé du langage naturel, écrit dans les langages de programmation Python et Cython.
Ce cours de Spacy aide à démarrer avec Spacy.Matplotlib est une bibliothèque complète pour créer des visualisations statiques, animées et interactives dans Python.
Reportez-vous aux tutoriels officiels pour plus de détails et de mise en œuvre.SeaBorn est une bibliothèque de visualisation des données Python basée sur Matplotlib. Il fournit une interface de haut niveau pour dessiner des graphiques statistiques attrayants et informatifs.
Reportez-vous aux tutoriels officiels pour plus de détails et de mise en œuvre. Reportez-vous à la galerie à Knoe sur divers types de parcelles présentes à SeaBorn.La bibliothèque graphique Python de Plotly fabrique des graphiques interactifs de qualité de publication. Exemples de la façon de fabriquer des parcelles de ligne, des parcelles de dispersion, des graphiques de zone, des graphiques à barres, des barres d'erreur, des parcelles de boîte, des histogrammes, des cartes thermiques, des sous-parcelles, des axes multiples, des graphiques polaires et des graphiques à bulles.
Scikit-Learn est une bibliothèque d'apprentissage automatique logicielle gratuite pour le langage de programmation Python. Il dispose de divers clustering algorithms classification , regression et de clustering. Il est conçu pour interopérer avec les bibliothèques numériques et scientifiques Python Numpy et Scipy.
L'introduction à ML avec Scikit-Learn et 50 Scikit-Learn Tips sont les meilleurs cours disponibles gratuitement fournis par Data School pour apprendre Scikit-Learn
Fastai est une bibliothèque d'apprentissage en profondeur qui fournit aux praticiens des composants de haut niveau qui peuvent fournir rapidement et facilement des résultats de pointe dans des domaines d'apprentissage en profondeur standard, et fournit aux chercheurs des composants de bas niveau qui peuvent être mitigés et appariés pour construire de nouvelles approches. Vérifiez la page pour plus d'informations.
Reportez-vous aux tutoriels officiels pour plus de détails et de mise en œuvre. Pytorch est un cadre d'apprentissage en profondeur développé par Meta qui permet une expérimentation rapide et flexible et une production efficace grâce à une formation frontale conviviale, une formation distribuée et un écosystème d'outils et de bibliothèques.
Tensorflow est un cadre d'apprentissage en profondeur développé par Google . Il s'agit d'une bibliothèque logicielle gratuite et open source pour l'apprentissage automatique et l'intelligence artificielle. Il peut être utilisé dans une gamme de tâches, mais a un accent particulier sur la formation et l'inférence des réseaux de neurones profonds.
Kaggle est la plus grande communauté de données où l'on peut partager son travail, participer à des compétitions, apprendre des cours gratuits et beaucoup plus.
Pour en tirer le meilleur parti de Kaggle, participez à tout concours qui est dans le domaine de votre intérêt. Les compétitions sont divisées en 3 catégories Tabular , Computer Vision , NLP . S'il n'y a pas de compétitions actives, tentez des compétitions passées qui vous intéressent. Si vous êtes coincé à un moment donné, référez-vous publiquement des cahiers avaliables / Post dans le forum de discussion. Il existe un nombre éorome d'ensembles de données disponibles sur Kaggle. Vous pouvez également télécharger des ensembles de données et démarrer votre propre projet
Ce site Web contient une liste de compétitions de ML en cours sur diverses plateformes
Ce blog écrit par Vetrivel PS possède la liste des plateformes de concours de science des données.
Papers with Code sont une ressource gratuite et ouverte avec des papiers d'apprentissage automatique, du code, des ensembles de données, des méthodes et des tables d'évaluation.
Tout dans PWC est divisé en catégories, ce qui facilite l'obtention de papier particulier. Accédez à la catégorie / champ qui vous intéresse ( Browse State-of-the-Art ). Sélectionnez n'importe quel article basé sur un ensemble de données de référence / les plus implémentés / bibliothèques. Vous pouvez également trouver des implémentations de code dans divers cadres.
Lisez le papier. Implémentez l'algorithme / modèle avec votre cadre préféré. Formez-le avec des données factices pour vérifier. C'est la meilleure façon de se lancer dans la recherche.
Andrej Karpathy
Krishnaik
StatQuest avec Josh Starmer
3BLUE1BROWN
Deeplearningai
Lex Fridman
Yannic Kilcher
Henry AI Labs
Qu'est-ce que l'AI
Daniel Bourke
Tensorflow
profondément
Aladdin Persson
Sreeni numérique
L'été de l'IA
Distiller
Google AI
Meta Ai
AI ouvert
AWS Machine Learning
Blog Microsoft AI
Lil'log
Hack Weekly
Deepwizai
aman.ai
Papiers avec code
arxiv
ARXIV SANITY
Scihub
Se gêner
Papiers avec code
Open ML
CS231N: vision informatique
CS224N: Traitement du langage naturel
CS224W: Apprentissage automatique avec graphiques
CS285: apprentissage du renforcement
LLM-Course: Ressources compilées pour en savoir plus sur les LLM
DeepLearning.ai
Signal Alpha: The Weekly Digest pour les chercheurs et ingénieurs de l'IA
Papiers avec code
Qu'est-ce que l'AI
Dair.ai's Top ML Papers of the Week
Dose quotidienne de la science des données
Ce site dispose de toute liste des GPU cloud disponibles et de leurs prix
Yannic Kilcher (Discord)
Cord.ai (slack)
MLSPACE: La communauté d'apprentissage automatique (Abhishek Thakur) (Discord)
Poids et biais: modèles en train et en amende, gérer les modèles de l'expérimentation à la production
Face étreinte: la plate-forme où la communauté d'apprentissage automatique collabore sur des modèles, des ensembles de données et des applications.
Pytorch Lightning: Pytorch Lightning est le cadre d'apprentissage en profondeur pour les chercheurs professionnels d'IA et les ingénieurs d'apprentissage automatique qui ont besoin d'une flexibilité maximale sans sacrifier les performances à grande échelle.
Bibliothèques automliques: Pycaret, H2O Automl, Autokeras, Flaml
Déploiement [débutant]: flacon, rationalisation
Langchain: Langchain est un cadre conçu pour simplifier la création d'applications à l'aide de grands modèles de langage.