Mlops géniaux
Une liste organisée d'outils MOLPS impressionnants.
Inspiré par un python génial.
- Mlops géniaux
- Automatique
- CI / CD pour l'apprentissage automatique
- Surveillance de l'emploi Cron
- Catalogue de données
- Enrichissement des données
- Exploration des données
- Gestion des données
- Informatique
- Validation des données
- Visualisation des données
- Détection de dérive
- Ingénierie de caractéristiques
- Magasin de fonctionnalités
- Réglage hyperparamètre
- Partage des connaissances
- Plate-forme d'apprentissage automatique
- Équité et intimité du modèle
- Interprétabilité du modèle
- Cycle de vie du modèle
- Modèle de service
- Test et validation du modèle
- Outils d'optimisation
- Outils de simplification
- Analyse visuelle et débogage
- Outils de flux de travail
- Ressources
- Articles
- Livres
- Événements
- Autres listes
- Podcasts
- Mou
- Sites Web
- Contributif
Automatique
Outils pour effectuer Automl.
- Autogluon - Apprentissage automatique automatisé pour l'image, le texte, le tabulaire, les séries chronologiques et les données multimodales.
- Autokeras - L'objectif Autokeras est de rendre l'apprentissage automatique accessible à tout le monde.
- AutopyTorch - Recherche d'architecture automatique et optimisation hyperparamètre pour Pytorch.
- Autosklearn - boîte à outils d'apprentissage automatique automatisé et remplacement de dépôt pour un estimateur Scikit-Learn.
- EVALML - Une bibliothèque qui construit, optimise et évalue les pipelines ML à l'aide de fonctions spécifiques au domaine.
- FLAML - trouve des modèles ML précis, efficacement et économiquement.
- H2O Automl - Automatise le flux de travail ML, qui comprend une formation automatique et un réglage des modèles.
- MINDSDB - Couche AI pour les bases de données qui vous permet de développer, former et déployer sans effort les modèles ML.
- MLBOX - MLBOX est une puissante bibliothèque de python d'apprentissage automatique automatisé.
- Recherche de modèle - Framework qui implémente les algorithmes automliques pour la recherche d'architecture de modèle à grande échelle.
- NNI - une boîte à outils Open Source Automl pour l'automatise du cycle de vie de l'apprentissage automatique.
CI / CD pour l'apprentissage automatique
Outils pour effectuer CI / CD pour l'apprentissage automatique.
- ClearML - CI / CD automatique pour rationaliser votre flux de travail ML.
- CML - Bibliothèque open source pour implémenter CI / CD dans les projets d'apprentissage automatique.
- Projet Kitops - Open Source MLOPS qui facilite les transfert de modèle entre Data Scientist et DevOps.
Surveillance de l'emploi Cron
Outils pour surveiller les travaux CRON (travaux récurrents).
- Cronitor - Surveillez tout travail cron ou tâche planifiée.
- HealthChecksio - Surveillance simple et efficace de l'emploi CRON.
Catalogue de données
Outils pour le catalogage des données.
- AMUNDSEN - Découverte de données et moteur de métadonnées pour améliorer la productivité lors de l'interaction avec les données.
- Apache Atlas - fournit des capacités de gestion des métadonnées et de gouvernance ouvertes pour créer un catalogue de données.
- CKAN - DMS open-source (système de gestion des données) pour alimenter les pôles de données et les portails de données.
- Datahub - Tool de recherche et découverte généralisés de LinkedIn.
- MAGDA - Un catalogue de données open-source fédéré pour toutes vos mégadonnées et petites données.
- Metacat - Unified Metadata Exploration API Service for Hive, RDS, Teradata, Redshift, S3 et Cassandra.
- OpenMetadata - Un seul endroit pour découvrir, collaborer et obtenir vos données correctes.
Enrichissement des données
Outils et bibliothèques pour l'enrichissement des données.
- Splandon - Un système pour générer rapidement des données de formation avec une supervision faible.
- Upgini - enrichie les ensembles de données de formation avec des fonctionnalités de sources de données partagées publiques et communautaires.
Exploration des données
Outils pour effectuer l'exploration des données.
- Apache Zeppelin - permet d'analyse de données interactives et interactive et des documents collaboratifs.
- BAMBOOLIB - Une interface graphique intuitive pour Pandas DataFrames.
- DatapRep - Collectez, nettoyez et visualisez vos données dans Python.
- Google Colab - Service de carnet Jupyter hébergé qui ne nécessite aucune configuration à utiliser.
- Jupyter Notebook - Environnement de cahier basé sur le Web pour l'informatique interactive.
- JupyterLab - L'interface utilisateur de nouvelle génération pour Project Jupyter.
- JupyText - Jupyter Notebooks As Markdown Documents, Julia, Python ou R Scripts.
- Profilage Pandas - Créez des rapports de profilage HTML à partir d'objets Pandas DataFrame.
- Polynote - Le cahier polyglot avec support Scala de première classe.
Gestion des données
Outils pour effectuer la gestion des données.
- Arrikto - Dead Simple, Ultra Fast Storage pour le monde hybride de Kubernetes.
- BlazingsQL - un moteur SQL léger et accéléré GPU pour Python. Construit sur Rapids CUDF.
- Delta Lake - couche de stockage qui apporte des transactions acides évolutives à Apache Spark et à d'autres moteurs.
- Base de données DOLT - SQL que vous pouvez fourrer, clone, branche, fusionner, pousser et tirer comme un référentiel git.
- DUD - Un outil CLI léger pour les données de versioning aux côtés du code source et de la création de pipelines de données.
- DVC - Gestion et versioning des ensembles de données et des modèles d'apprentissage automatique.
- GIT LFS - Une extension GIT open source pour le version de fichiers volumineux.
- Hub - un format de jeu de données pour la création, le stockage et la collaboration sur des ensembles de données AI de toute taille.
- Apport - Un ensemble léger d'outils pour charger et partager des données dans les projets de science des données.
- LAKEFS - Data Lake reproductible, atomique et versé au-dessus du stockage des objets.
- Marquez - collecter, agréger et visualiser les métadonnées d'un écosystème de données.
- Milvus - un moteur de recherche de similitude vectorielle open source propulsé par FAISS, NMSLIB et ENATY.
- Recherche de similitude vectorielle gérée et distribuée utilisée avec un SDK léger.
- QDRANT - Un moteur de recherche de similitude vectorielle open source avec support de filtrage prolongé.
- Quilt - Un centre de données auto-organisé avec support S3.
Informatique
Outils liés au traitement des données et aux pipelines de données.
- FLOW AIR - PLATEFORME POUR PROGRAMMATION AUTOR, Planifiez et surveillez les workflows.
- Azkaban - Planiseur de travaux de workflow par lots créé sur LinkedIn pour exécuter des travaux Hadoop.
- Dagster - Un orchestrateur de données pour l'apprentissage automatique, l'analyse et ETL.
- Hadoop - Framework qui permet le traitement distribué de grands ensembles de données à travers les clusters.
- OpenRefine - Power Tool pour travailler avec des données désordonnées et l'améliorer.
- Spark - Unified Analytics Engine pour le traitement des données à grande échelle.
Validation des données
Outils liés à la validation des données.
- CERBERUS - Bibliothèque de validation des données légère et légère pour Python.
- CleanLab - Bibliothèque Python pour l'IA et l'apprentissage automatique centrées sur les données avec des données et des étiquettes désordonnées et réelles.
- Excellentes attentes - Un cadre de validation des données Python qui permet de tester vos données par rapport aux ensembles de données.
- SCHEMA JSON - Un vocabulaire qui vous permet d'annoter et de valider les documents JSON.
- TFDV - Une bibliothèque pour explorer et valider les données d'apprentissage automatique.
Visualisation des données
Outils pour la visualisation des données, les rapports et les tableaux de bord.
- Count - outil de requête et de visualisation SQL / Drag-and-Drop basé sur des ordinateurs portables.
- DASH - Applications Web analytiques pour Python, R, Julia et Jupyter.
- Data Studio - Solution de rapport pour les utilisateurs de puissance qui souhaitent aller au-delà des données et des tableaux de bord de GA.
- Facteurs - Visualisations pour comprendre et analyser les ensembles de données d'apprentissage automatique.
- Grafana - Analyse open source multiplateforme et application Web de visualisation interactive.
- Lux - Exploration de données rapide et facile en automatisant le processus de visualisation et d'analyse des données.
- Metabase - le moyen le plus simple et le plus rapide d'obtenir l'intelligence commerciale et l'analyse à tous.
- Redash - Connectez-vous à n'importe quelle source de données, visualisez facilement, tableau de bord et partagez vos données.
- Solidui - Prototypage de visualisation et plate-forme de montage généré par l'AI, support les modèles 2D et 3D.
- SuperSet - Application Web moderne et prête pour l'entreprise.
- Tableau - outil de visualisation des données puissante et la plus rapide utilisée dans l'industrie de l'intelligence d'affaires.
Détection de dérive
Outils et bibliothèques liés à la détection de dérive.
- Alibi Detect - Une bibliothèque Python open source s'est concentrée sur la détection des valeurs aberrantes, adversaires et de dérive.
- FOUROS - Une bibliothèque Python open source pour la détection de dérive dans les systèmes d'apprentissage automatique.
- TorchDrift - Une bibliothèque de dérive de données et de concept pour Pytorch.
Ingénierie de caractéristiques
Outils et bibliothèques liés à l'ingénierie des fonctionnalités.
- Fonctionnalité du moteur - Fonctionnalité d'ingénierie avec des fonctionnalités de type sklearn.
- Featuretools - Python Library pour l'ingénierie des fonctionnalités automatisées.
- TSFRESH - Bibliothèque Python pour l'extraction automatique des fonctionnalités pertinentes de la série chronologique.
Magasin de fonctionnalités
Caractéristiques des outils de stockage pour les services de données.
- Butterfree - Un outil pour la construction de magasins de fonctionnalités. Transformez vos données brutes en belles fonctionnalités.
- BYTEHUB - Un magasin de fonctionnalités faciles à utiliser. Optimisé pour les données de séries chronologiques.
- Fête - Bagfication de fonctions open source de bout en bout pour l'apprentissage automatique.
- FEATHR - Un magasin de fonctionnalités haute performance de qualité d'entreprise.
- FeatureForm - un magasin de fonctionnalités virtuels. Transformez votre infrastructure de données existante en un magasin de fonctionnalités.
- Tecton - Une plate-forme de fonctionnalité entièrement gérée conçue pour orchestrer le cycle de vie complet des fonctionnalités.
Réglage hyperparamètre
Outils et bibliothèques pour effectuer un réglage hyperparamètre.
- Advisor - Implémentation open source de Google Vizir pour le réglage des paramètres hyper.
- Hyperas - un emballage très simple pour une optimisation hyperparamètre pratique.
- Hyperopt - Optimisation d'hyperparamètre asynchrone distribuée dans Python.
- Système basé sur Katib - Kubernetes pour le réglage de l'hyperparamètre et la recherche d'architecture neuronale.
- Kerastuner - Cadre d'optimisation hyperparamètre facile à utiliser et évolutive.
- OPTUNA - Open Source Hyperparamètre Optimization Framework pour automatiser la recherche d'hyperparamètre.
- Scikit Optimize - Bibliothèque simple et efficace pour minimiser les fonctions de boîte noire coûteuse et bruyante.
- Talos - Optimisation d'hyperparamètre pour Tensorflow, Keras et Pytorch.
- Tune - Bibliothèque Python pour l'exécution de l'expérience et le réglage de l'hyperparamètre à n'importe quelle échelle.
Partage des connaissances
Outils pour partager les connaissances avec toute l'équipe / l'entreprise.
- Repôt de connaissances - Plateforme de partage des connaissances pour les scientifiques des données et autres professions techniques.
- KYSO - Un endroit pour les informations de données afin que toute votre équipe puisse apprendre de vos données.
Plate-forme d'apprentissage automatique
Solutions complètes de plate-forme d'apprentissage automatique.
- AIWARE - AIWARE aide les équipes MLOPS à évaluer, déployer, intégrer, mettre à l'échelle et surveiller les modèles ML.
- Algorithmia - régimez en toute sécurité vos opérations d'apprentissage automatique avec un cycle de vie en bonne santé.
- Allegro AI - Transformez la recherche ML / DL en produits. Plus rapide.
- Bodywork - déploie des projets d'apprentissage automatique développés dans Python, à Kubernetes.
- CNVRG - Une plate-forme d'apprentissage automatique de bout en bout pour créer et déployer des modèles AI à grande échelle.
- DAGSHUB - Une plate-forme construite sur des outils open source pour la gestion des données, des modèles et des pipelines.
- DataiKu - Plateforme démocratisant l'accès aux données et permettant aux entreprises de construire leur propre chemin vers l'IA.
- Datarobot - Plateforme d'IA qui démocratise la science des données et automatise le ML de bout en bout à grande échelle.
- Domino - Un endroit pour vos outils de science des données, les applications, les résultats, les modèles et vos connaissances.
- Edge Impulse - Plate-forme pour la création, l'optimisation et le déploiement d'algorithmes AI / ML pour les appareils Edge.
- Environnement de développement de l'apprentissage automatique pour les équipes de science des données et d'ingénierie AI / ML.
- FedML - simplifie le flux de travail de l'apprentissage fédéré n'importe où à n'importe quelle échelle.
- Gradient - Multicloud CI / CD et plate-forme MOLPS pour les équipes d'apprentissage automatique.
- H2O - leader open source dans l'IA avec une mission de démocratiser l'IA pour tout le monde.
- Hopsworks - plate-forme open source pour le développement et les modèles d'apprentissage automatique à grande échelle.
- Iguazio - plate-forme de science des données qui automatise les MOPL avec des pipelines d'apprentissage automatique de bout en bout.
- Katonic - Automatisez votre cycle d'intelligence avec la plate-forme Katonic Mlops.
- KNIME - Créez et productionz la science des données à l'aide d'un environnement facile et intuitif.
- KUBEFLOW - Faire des déploiements de workflows ML sur Kubernetes Simple, portable et évolutif.
- Lynxkite - Une plate-forme complète de science des données de graphiques pour les très grands graphiques et autres ensembles de données.
- ML Workspace - IDE Web tout-en-un spécialisé pour l'apprentissage automatique et la science des données.
- MLREEF - plate-forme Mlops open source qui vous aide à collaborer, reproduire et partager votre travail ML.
- Modzy - Déployer, connecter, exécuter et surveiller les modèles d'apprentissage automatique (ML) dans l'entreprise et au bord.
- La plate-forme Neu.ro - Mlops qui intègre des outils open-source et propriétaires dans les systèmes axés sur le client.
- Omnimizer - Simplifie et accélère les MLOPS en rédigeant l'écart entre les modèles ML et le matériel de bord.
- PACHYDERM - combine la lignée de données avec des pipelines de bout en bout sur Kubernetes, conçus pour l'entreprise.
- Polyaxon - Une plate-forme pour l'apprentissage automatique reproductible et évolutif et l'apprentissage en profondeur sur Kubernetes.
- Sagemaker - Service entièrement géré qui offre la possibilité de construire, de former et de déployer rapidement les modèles ML.
- SAS VIYA - Cloud Native IA, analytique et plate-forme de gestion des données qui prend en charge le cycle de vie analytique.
- SEMATIC - Un outil de pipelining de bout en bout open source pour passer du prototype d'ordinateur portable au cloud en un rien de temps.
- SIGOPT - Une plate-forme qui facilite le suivi des courses, visualise la formation et l'échelle du réglage de l'hyperparamètre.
- TrueFoundry - une plate-forme MLOPS-Native Cloud via Kubernetes pour simplifier la formation et le service des modèles ML.
- Valohai - vous emmène du POC à la production tout en gérant l'ensemble du cycle de vie du modèle.
Équité et intimité du modèle
Outils pour effectuer l'équité et la confidentialité des modèles en production.
- AIF360 - Un ensemble complet de mesures d'équité pour les ensembles de données et les modèles d'apprentissage automatique.
- FairLearn - un package Python pour évaluer et améliorer l'équité des modèles d'apprentissage automatique.
- OPACUS - Une bibliothèque qui permet la formation de modèles Pytorch avec une confidentialité différentielle.
- Tensorflow Privacy - Library for Training Machine Learning Modèles avec confidentialité pour la formation des données.
Interprétabilité du modèle
Outils pour effectuer une interprétabilité / explicabilité du modèle.
- Alibi - bibliothèque Python open source permettant l'inspection et l'interprétation du modèle ML.
- Captum - Interprétabilité et compréhension de la bibliothèque pour Pytorch.
- Package Eli5 - Python qui aide à déboguer les classificateurs d'apprentissage automatique et à expliquer leurs prédictions.
- Interprétml - Une boîte à outils pour aider à comprendre les modèles et à permettre l'apprentissage automatique responsable.
- Lime - Expliquer les prédictions de tout classificateur d'apprentissage automatique.
- Lucid - Collection d'infrastructures et d'outils de recherche sur l'interprétabilité du réseau neuronal.
- SAGE - Pour calculer l'importance des fonctionnalités globales en utilisant les valeurs de Shapley.
- Shap - une approche théorique du jeu pour expliquer la sortie de tout modèle d'apprentissage automatique.
Cycle de vie du modèle
Outils pour gérer le cycle de vie du modèle (expériences de suivi, paramètres et métriques).
- Aeromancy - Un cadre pour effectuer une IA et ML reproductibles pour les poids et les biais.
- AIM - Une façon super facile d'enregistrer, de rechercher et de comparer les milliers de courses de cours ML.
- Cascade - Library of ML-Engineering Outils pour le prototypage rapide et la gestion des expériences.
- COMET - Suivez vos ensembles de données, vos changements de code, votre historique d'expérimentation et les modèles.
- Guild AI - Suivi des expériences open source, automatisation des pipelines et réglage hyperparamètre.
- KeepSake - Contrôle de la version pour l'apprentissage automatique avec le support sur Amazon S3 et Google Cloud Storage.
- Losswise - permet de suivre facilement les progrès d'un projet d'apprentissage automatique.
- MLFlow - Plate-forme open source pour le cycle de vie d'apprentissage automatique.
- ModelDB - Open Source ML Model Versioning, Metadata et Experiment Management.
- Neptune AI - L'outil de gestion des expériences le plus léger qui correspond à n'importe quel flux de travail.
- Sacré - Un outil pour vous aider à configurer, organiser, enregistrer et reproduire des expériences.
- Poids et biais - Un outil pour visualiser et suivre vos expériences d'apprentissage automatique.
Modèle de service
Outils pour servir les modèles en production.
- Banana - Hébergez votre code d'inférence ML sur des GPU sans serveur et intégrez-le dans votre application avec une seule ligne de code.
- Beam - Développer sur des GPU sans serveur, déployer des API hautement performants et prototyper rapidement les modèles ML.
- Bentoml - plate-forme open source pour le service de modèle ML haute performance.
- BudgetML - Déployez un service d'inférence ML sur un budget en moins de 10 lignes de code.
- COG - outil open-source qui vous permet d'emballer les modèles ML dans un conteneur standard prêt pour la production.
- Cortex - modèle d'apprentissage automatique desservant l'infrastructure.
- GeniUSRISE - API d'inférence de l'hôte, inférence en vrac et textes, vision, audio et modèles multimodaux.
- Gradio - Créez des composants d'interface utilisateur personnalisables autour de vos modèles.
- Graphpipe - Déploiement du modèle d'apprentissage automatique Rendu simple.
- Hydrosphère - Plateforme pour déployer votre apprentissage automatique à la production.
- KFSERVing - Définition de ressources personnalisées Kubernetes pour servir les modèles ML sur des cadres arbitraires.
- API de repos de remplacement localai - compatible avec les spécifications de l'API OpenAI pour l'inférence.
- Merlin - Une plate-forme pour le déploiement et le service de modèles d'apprentissage automatique.
- MLEM - Version et déployez vos modèles ML en suivant les principes Gitops.
- Opyrator - transforme votre code ML en microservices avec API Web, GUI interactive, etc.
- Predictionio - Collection d'événements, déploiement d'algorithmes, évaluation, interroger les résultats prédictifs via les API.
- Quix - Plate-forme sans serveur pour le traitement des flux de données en temps réel avec des modèles d'apprentissage automatique.
- Rune - fournit des conteneurs pour encapsuler et déployer des pipelines Edgeml et des applications.
- SELDON - Passez vos projets ML du POC à la production avec une efficacité maximale et un risque minimal.
- Streamlit - vous permet de créer des applications pour vos projets ML avec des scripts Python trompeusement simples.
- Tensorflow Serving - Système de service flexible et haute performance pour les modèles ML, conçu pour la production.
- TORCHSERVE - Un outil flexible et facile à utiliser pour servir les modèles Pytorch.
- Triton Inference Server - Fournit une solution d'inférence Cloud et Edge optimisée.
- VESPA - Stocker, rechercher, organiser et faire des inférences apprises à la machine sur les mégadonnées à l'heure de service.
- Wallaroo.ai - une plate-forme de déploiement, de service et d'optimisation des modèles ML dans les environnements cloud et bord.
Test et validation du modèle
Outils pour tester et valider les modèles.
- Deepchecks - Package open source pour valider les modèles et données ML, avec diverses vérifications et suites.
- Starwhale - Une plate-forme MOPL / LLMOPS pour la construction de modèles, l'évaluation et le réglage fin.
- Trubrics - Valider l'apprentissage automatique avec la science des données et les commentaires des experts du domaine.
Outils d'optimisation
Outils d'optimisation liés à l'évolutivité du modèle dans la production.
- Accélérer - Un moyen simple de s'entraîner et d'utiliser des modèles Pytorch avec multi-GPU, TPU, précision mixte.
- Dask - fournit un parallélisme avancé pour l'analyse, permettant aux performances des performances des outils que vous aimez.
- Deeppeed - Deep Learning Optimization Library qui rend la formation distribuée facile, efficace et efficace.
- Fibre - Python Distributed Computing Library for Modern Computer Clusters.
- HOROVOD - Framework de formation en profondeur distribuée pour TensorFlow, Keras, Pytorch et Apache Mxnet.
- MAHOUT - Framebra d'algèbre linéaire distribué et Scala DSL expressif mathématique.
- MLIB - bibliothèque d'apprentissage automatique évolutive d'Apache Spark.
- MODIN - accélérez vos workflows Pandas en modifiant une seule ligne de code.
- NEBULLVM - Bibliothèque facile à utiliser pour augmenter l'inférence de l'IA.
- NOS - Module open-source pour exécuter des charges de travail AI sur Kubernetes de manière optimisée.
- Petastorm - permet une formation unique ou distribuée et une évaluation des modèles d'apprentissage en profondeur.
- Rapids - donne la possibilité d'exécuter entièrement des pipelines de science des données et d'analyses de bout en bout sur GPU.
- Ray - Cadre rapide et simple pour la construction et l'exécution d'applications distribuées.
- SINGA - Projet de haut niveau Apache, en se concentrant sur la formation distribuée des modèles DL et ML.
- TPOT - outil ML automatisé qui optimise les pipelines d'apprentissage automatique à l'aide de la programmation génétique.
Outils de simplification
Outils liés à la simplification et à la normalisation de l'apprentissage automatique.
- Châssis - transforme les modèles en conteneurs conviviaux ML qui fonctionnent à peu près n'importe où.
- Hermione - Aide les scientifiques des données sur la mise en place de codes plus organisés, d'une manière plus rapide et plus simple.
- HYDRA - Un cadre pour la configuration élégamment des applications complexes.
- Koalas - API Pandas sur Apache Spark. Rend les scientifiques des données plus productives lors de l'interaction avec les mégadonnées.
- Ludwig - permet aux utilisateurs de former et de tester des modèles d'apprentissage en profondeur sans avoir besoin d'écrire de code.
- Mlnotify - Pas besoin de continuer à vérifier votre formation, une seule ligne d'importation et vous saurez la seconde où cela est fait.
- Pycaret - bibliothèque d'apprentissage automatique open source et à faible code dans Python.
- Sagify - Un utilitaire CLI pour former et déployer des modèles ML / DL sur AWS SageMaker.
- SOOPERVISOR - Exporter les projets ML vers Kubernetes (flux de travail Argo), Airflow, AWS Batch et Slurm.
- SOORGEON - Convertir des cahiers de jupyter monolithique en pipelines maintenables.
- TRAINGENERATOR - Une application Web pour générer du code de modèle pour l'apprentissage automatique.
- Turi Create - simplifie le développement de modèles d'apprentissage automatique personnalisés.
Analyse visuelle et débogage
Outils pour effectuer une analyse visuelle et un débogage des modèles ML / DL.
- Aporia - observabilité avec surveillance personnalisée et explicabilité pour les modèles ML.
- Arize - une plateforme d'observabilité ML de bout en bout et de plate-forme de surveillance du modèle.
- De toute évidence - des rapports interactifs pour analyser les modèles ML pendant la validation ou la surveillance de la production.
- Fiddler - Surveillez, expliquez et analysez votre IA en production.
- Modifold - Un outil de débogage visuel d'agnostiques modèle pour l'apprentissage automatique.
- Nannyml - Algorithme capable de capturer pleinement l'impact de la dérive des données sur les performances.
- Nettron - Visualizer pour le réseau neuronal, l'apprentissage en profondeur et les modèles d'apprentissage automatique.
- OPIK - Évaluer, tester et expédier les applications LLM avec une suite d'outils d'observabilité.
- Phoenix - Mlops dans un ordinateur portable pour le dépannage et les modèles génératifs, CV et tabulaires génératifs.
- Radicalbit - La solution open source pour surveiller vos modèles d'IA en production.
- Superwise - Observabilité du modèle entièrement automatisé de qualité entreprise dans une plate-forme SaaS en libre-service.
- WhyLogs - La norme open source pour la journalisation des données. Permet la surveillance et l'observabilité ML.
- Yellowbrick - Analyse visuelle et outils de diagnostic pour faciliter la sélection du modèle d'apprentissage automatique.
Outils de flux de travail
Outils et cadres pour créer des workflows ou des pipelines dans le contexte d'apprentissage automatique.
- ARGO - moteur de workflow natif de conteneurs open source pour orchestrer des travaux parallèles sur Kubernetes.
- Automatiser Studio - Créer et déployer rapidement les workflows alimentés par AI.
- Couler - Interface unifiée pour la construction et la gestion des workflows sur différents moteurs de flux de travail.
- DSTACK - Un outil ouvert pour automatiser les données et la formation des flux de travail.
- Flyte - Facile à créer des flux de travail simultanés, évolutifs et maintenables pour l'apprentissage automatique.
- Hamilton - Un micro-travail à usage général évolutif pour définir les flux de données.
- Kale - vise à simplifier l'expérience en science des données du déploiement de workflows de pipelines Kubeflow.
- Kedro - Library qui implémente l'ingénierie logicielle la meilleure pratique pour les données et les pipelines ML.
- Module Luigi - Python qui vous aide à construire des pipelines complexes de travaux de lots.
- Metaflow - LIB respectueuse de l'homme qui aide les scientifiques et les ingénieurs à construire et à gérer les projets de science des données.
- MLRUN - Mécanisme générique pour les scientifiques des données à construire, à exécuter et à surveiller les tâches et les pipelines ML.
- Orchest - Visual Pipeline Editor and Workflow Orchestrator avec une interface utilisateur facile à utiliser et basée sur Kubernetes.
- Piloomber - Écrivez des pipelines maintenables et prêts à la production. Développez localement, déploiez-vous vers le cloud.
- Préfet - Un système de gestion du flux de travail, conçu pour les infrastructures modernes.
- VDP - Un outil open-source pour intégrer de manière transparente l'IA pour les données non structurées dans la pile de données moderne.
- Wordware - Un IDE hébergé par le Web où les experts du domaine non technique peuvent créer des agents d'IA spécifiques aux tâches.
- ZENML - Un cadre MOLPS open source extensible pour créer des pipelines reproductibles.
Ressources
Où découvrir de nouveaux outils et discuter de ceux existants.
Articles
- Une visite des plates-formes d'apprentissage automatique de bout en bout (Databaseline)
- Livraison continue pour l'apprentissage automatique (Martin Fowler)
- Livrer la vision de MOPLS: une approche basée sur la maturité (Gigaom)
- Opérations d'apprentissage automatique (MLOPS): Présentation, définition et architecture (ARXIV)
- Feuille de route Mlops: un guide de carrière MOPLOP complet (Blogs Scaller)
- Mlops: Pipelines de livraison et d'automatisation continus dans l'apprentissage automatique (Google)
- MOLPS: L'apprentissage automatique en tant que discipline d'ingénierie (médium)
- Règles de l'apprentissage automatique: meilleures pratiques pour l'ingénierie ML (Google)
- Le score de test ML: une rubrique pour la préparation à la production ML et la réduction de la dette technique (Google)
- Qu'est-ce que les Mlops? (Nvidia)
Livres
- Début Mlops avec mlflow (apress)
- Construire des pipelines d'apprentissage automatique (O'Reilly)
- Applications alimentées par l'apprentissage automatique (O'Reilly)
- Deep Learning in Production (IA Summer)
- Conception de systèmes d'apprentissage automatique (O'Reilly)
- Ingénierie Mlops (Packt)
- Mise en œuvre de Mlops dans l'entreprise (O'Reilly)
- Présentation de mlops (O'Reilly)
- Kubeflow pour l'apprentissage automatique (O'Reilly)
- Guide des opérations de Kubeflow (O'Reilly)
- Motifs de conception d'apprentissage automatique (O'Reilly)
- Génie de l'apprentissage automatique en action (Manning)
- ML OPS: Opérationnalisation de la science des données (O'Reilly)
- Mlops Engineering à grande échelle (Manning)
- Boîte à outils de cycle de vie Mlops (APRESS)
- Apprentissage en profondeur pratique à grande échelle avec MLFlow (Packt)
- Mlops pratiques (O'Reilly)
- Apprentissage appliqué en production (Packt)
- Apprentissage automatique fiable (O'Reilly)
- The Machine Learning Solutions Architect Handbook (Packt)
Événements
- appliquer () - la conférence ML Data Engineering
- Conférence Mlops - Keynotes and Panels
- MOPLOP WORLD: Machine Learning in Production Conference
- NORMCONF - La Conférence technologique Normcore
- Série de séminaires de Stanford MLSYS
Autres listes
- ML appliqué
- Documents automobiles impressionnants
- Automne génial
- Awesome Data Science
- Fortives de données
- Apprentissage en profondeur génial
- Ensembles de données de jeu impressionnants (comprend le contenu AI)
- Apprentissage automatique génial
- Mlops géniaux
- Apprentissage de la machine de production génial
- Génial python
- Apprentissage en profondeur dans la production
Podcasts
- Comment AI a construit ceci
- Podcast Kubernetes de Google
- Apprentissage automatique - génie logiciel quotidiennement
- Mlops.community
- Conversation de pipeline
- IA pratique: apprentissage automatique, science des données
- Cette semaine dans l'apprentissage automatique et l'IA
- Vrai ML Talks
Mou
- Espace de travail Kubeflow
- MOPLOP Community Wokspace
Sites Web
- Magasins de fonctionnalités pour ML
- Fait avec ML
- ML-OPS
- Communauté Mlops
- Guide MOPL
- Mlops maintenant
Contributif
Toutes les contributions sont les bienvenues! Veuillez d'abord consulter les directives de contribution.