Tolle Mlops
Eine kuratierte Liste fantastischer MLOPS -Tools.
Inspiriert von Awesome-Python.
- Tolle Mlops
- Automl
- CI/CD für maschinelles Lernen
- Cron -Jobüberwachung
- Datenkatalog
- Datenanreicherung
- Datenexploration
- Datenverwaltung
- Datenverarbeitung
- Datenvalidierung
- Datenvisualisierung
- Drifterkennung
- Feature Engineering
- Feature Store
- Hyperparameterabstimmung
- Wissensaustausch
- Maschinelles Lernenplattform
- Model Fairness und Privatsphäre
- Modellinterpretierbarkeit
- Modelllebenszyklus
- Modelldienste
- Modelltests und Validierung
- Optimierungstools
- Vereinfachungswerkzeuge
- Visuelle Analyse und Debugging
- Workflow -Tools
- Ressourcen
- Artikel
- Bücher
- Ereignisse
- Andere Listen
- Podcasts
- Locker
- Websites
- Beitragen
Automl
Tools zur Durchführung von Automl.
- Autogluon-Automatisches maschinelles Lernen für Bild-, Text-, Tabellen-, Zeitreihen- und Multimodaldaten.
- Autokeras - AutoKeras -Ziel ist es, maschinelles Lernen für alle zugänglich zu machen.
- AutopyTorch - Automatische Architektursuche und Hyperparameteroptimierung für Pytorch.
- Autosklearn-Automatisches Toolkit für maschinelles Lernen und ein Drop-In-Ersatz für einen Scikit-Learn-Schätzer.
- Evalml - Eine Bibliothek, die ML -Pipelines mithilfe domänenspezifischer Funktionen erstellt, optimiert und bewertet.
- FLAML - Findet genaue ML -Modelle automatisch, effizient und wirtschaftlich.
- H2O Automl - Automatisiert den ML -Workflow, der automatisches Training und Tuning von Modellen umfasst.
- MindSdb - AI -Schicht für Datenbanken, mit denen Sie ML -Modelle mühelos entwickeln, trainieren und bereitstellen können.
- MLBOX - MLBOX ist eine leistungsstarke Python -Bibliothek für maschinelles Lernen.
- Modellsuche - Framework, das Automl -Algorithmen für die Modellarchitektursuche im Maßstab implementiert.
- NNI - Ein Open Source -Automobil -Toolkit zum automatischen Lebenszyklus für maschinelles Lernen.
CI/CD für maschinelles Lernen
Tools zur Durchführung von CI/CD für maschinelles Lernen.
- Clearml - Auto -Magical CI/CD, um Ihren ML -Workflow zu optimieren.
- CML - Open -Source -Bibliothek zur Implementierung von CI/CD in maschinellen Lernprojekten.
- KitOs - Open Source MLOPS -Projekt, das Modellhandoffs zwischen Datenwissenschaftlern und DevOps erleichtert.
Cron -Jobüberwachung
Tools zur Überwachung von Cron -Jobs (wiederkehrende Jobs).
- Cronitor - Überwachen Sie einen Cron -Job oder eine geplante Aufgabe.
- HealthChecksio - Einfache und effektive Überwachung von Cron -Jobs.
Datenkatalog
Tools für die Datenkatalogisierung.
- Amundsen - Datenerfassung und Metadatenmotor zur Verbesserung der Produktivität bei der Interaktion mit Daten.
- Apache Atlas - Bietet offene Metadatenmanagement- und Governance -Funktionen, um einen Datenkatalog zu erstellen.
- CKAN - Open -Source -DMS (Datenverwaltungssystem) zum Stromversorgungsmittel und Datenportale.
- DATAHUB - LinkedIns generalisiertes Metadaten -Such- und Erkennungs -Tool.
- MAGDA - Ein föderierter Open -Source -Datenkatalog für alle Ihre Big -Data und kleinen Daten.
- Metacat - Unified Metadata Exploration API -Dienst für Hive, RDS, Teradata, Redshift, S3 und Cassandra.
- OpenMetadata - Ein einzelner Ort, um Ihre Daten zu entdecken, zusammenzuarbeiten und Ihre Daten richtig zu machen.
Datenanreicherung
Tools und Bibliotheken für die Datenanreicherung.
- Schnorchel - Ein System zum schnellen Generieren von Trainingsdaten mit schwacher Überwachung.
- UPGINI - Bereicherung Datensätze mit Funktionen aus öffentlichen und Community Shared Data Quellen.
Datenexploration
Tools zur Durchführung von Datenerforschung.
- Apache Zeppelin - Ermöglicht datengesteuerte, interaktive Datenanalysen und kollaborative Dokumente.
- Bamboolib - Eine intuitive GUI für Pandas -Datenframes.
- DataPrep - Sammeln, reinigen und visualisieren Sie Ihre Daten in Python.
- Google Colab - Hosted Jupyter Notebook -Dienst, für das kein Einrichten erforderlich ist.
- Jupyter Notebook - Webbasierte Notebook -Umgebung für interaktives Computing.
- JupyterLab - Die Benutzeroberfläche der nächsten Generation für Projekt Jupyter.
- JupyText - Jupyter -Notizbücher als Markdown -Dokumente, Julia, Python oder R -Skripte.
- PANDAS -Profilerstellung - Erstellen Sie HTML -Profiling -Berichte von Pandas DataFrame -Objekten.
- Polynote - Das Polyglot -Notizbuch mit erstklassiger Scala -Unterstützung.
Datenverwaltung
Tools zur Durchführung von Datenverwaltung.
- Arriko - Dead Simple, Ultra Fast Storage für die Hybrid Kubernetes -Welt.
- Blazingsql - Ein leichter, gpu beschleunigter SQL -Motor für Python. Gebaut auf Rapids Cudf.
- Delta Lake - Speicherschicht, die skalierbare Säuretransaktionen zu Apache -Funken und anderen Motoren bringt.
- DOLT - SQL -Datenbank, die Sie wie ein Git -Repository wie ein Git -Repository gabeln, klon, abzahlen, verschmelzen, drücken und ziehen können.
- DUD - Ein leichtes CLI -Tool zum Versioning von Daten neben Quellcode und Erstellung von Datenpipelines.
- DVC - Verwaltung und Versionierung von Datensätzen und maschinellem Lernmodellen.
- GIT LFS - Eine Open -Source -Git -Erweiterung für Versionen großer Dateien.
- HUB - Ein Datensatzformat zum Erstellen, Speichern und Zusammenarbeit mit KI -Datensätzen in jeder Größe.
- Einnahme - Ein leichter Satz von Tools zum Laden und Teilen von Daten in Datenwissenschaftsprojekten.
- Lakefs - Wiederholbare, atomische und versionierte Datensee auf dem Objektspeicher.
- Marquez - Sammeln, aggregieren und visualisieren Sie die Metadaten eines Datenökosystems.
- MILVUS - Eine Open Source -Einbettungs -Vektor -Ähnlichkeitssuchmaschine, die von Faiss, NMSLIB und Ärger betrieben wird.
- Pinecone - Managierte und verteilte Vektor -Ähnlichkeitssuche, die mit einem leichten SDK verwendet wird.
- QDRANT - Eine Open -Source -Vektor -Ähnlichkeitssuchmaschine mit erweiterter Filterunterstützung.
- Quilt - Ein selbstorganisierender Datenzentrum mit S3 -Unterstützung.
Datenverarbeitung
Tools im Zusammenhang mit Datenverarbeitung und Datenpipelines.
- AirFlow - Plattform zum programmgesteuerten Autor, planen und überwachen Arbeitsabläufe.
- Azkaban - Batch Workflow Job Scheduler bei LinkedIn, um Hadoop -Jobs zu leiten.
- Dagster - Ein Datenorchestrator für maschinelles Lernen, Analysen und ETL.
- Hadoop - Framework, das die verteilte Verarbeitung großer Datensätze über Cluster hinweg ermöglicht.
- OpenRefine - Elektrowerkzeug zur Arbeit mit unordentlichen Daten und Verbesserung.
- Spark - Unified Analytics Engine für die groß angelegte Datenverarbeitung.
Datenvalidierung
Tools im Zusammenhang mit der Datenvalidierung.
- Cerberus - Leichte, erweiterbare Datenvalidierungsbibliothek für Python.
- CleanLab-Python-Bibliothek für datenzentrierte KI und maschinelles Lernen mit chaotischen, realen Daten und Beschriftungen.
- Großartige Erwartungen - Ein Python -Datenvalidierungs -Framework, mit dem Ihre Daten gegen Datensätze getestet werden können.
- JSON -Schema - Ein Wortschatz, mit dem Sie JSON -Dokumente kommentieren und validieren können.
- TFDV - Eine Bibliothek zum Erforschen und Validieren von Daten für maschinelles Lernen.
Datenvisualisierung
Tools für Datenvisualisierung, Berichte und Dashboards.
- Graf-SQL/Drag-and-Drop-Abfrage- und Visualisierungstool basierend auf Notebooks.
- Dash - Analytische Web -Apps für Python, R, Julia und Jupyter.
- Data Studio - Berichtslösung für Power -Benutzer, die über die Daten und Dashboards von GA hinausgehen möchten.
- Facetten - Visualisierungen zum Verständnis und Analysieren von Datensätzen für maschinelles Lernen.
- Grafana - Multi -Plattform Open Source Analytics und interaktive Visualisierungswebanwendung.
- Lux - schnelle und einfache Datenerforschung durch Automatisierung des Visualisierungs- und Datenanalyseprozesses.
- Metabase - Der einfachste und schnellste Weg, um Business Intelligence und Analytics an alle zu bringen.
- REDASH - Stellen Sie eine Verbindung zu einer beliebigen Datenquelle her, visualisieren, Dashboards und teilen Sie Ihre Daten.
- Solidui - AI -generierte Visualisierungsprototyping- und Bearbeitungsplattform, unterstützen 2D- und 3D -Modelle.
- Superset - Moderne Webanwendung für Unternehmen in der Business Intelligence.
- Tableau - leistungsstarkes und am schnellsten wachsender Datenvisualisierungsinstrument, das in der Business Intelligence -Branche verwendet wird.
Drifterkennung
Tools und Bibliotheken im Zusammenhang mit der Drifterkennung.
- Alibi Detect - Eine Open -Source -Python -Bibliothek, die sich auf Ausreißer, kontroverse und Drifterkennung konzentriert.
- Frouros - Eine Open -Source -Python -Bibliothek zur Drifterkennung in maschinellen Lernsystemen.
- Torchdrift - Eine Daten- und Konzept -Drift -Bibliothek für Pytorch.
Feature Engineering
Tools und Bibliotheken im Zusammenhang mit Feature Engineering.
- Feature Engine - Feature Engineering Package mit sklearn -ähnlichen Funktionen.
- Featuretools - Python Library für automatisierte Feature Engineering.
- TSFRESH - Python -Bibliothek zur automatischen Extraktion relevanter Funktionen aus Zeitreihen.
Feature Store
Feature Store -Tools für Datenbereitstellungen.
- Butterfree - Ein Werkzeug zum Baugeschäften. Verwandeln Sie Ihre Rohdaten in schöne Funktionen.
- BYTEHUB-Ein benutzerfreundlicher Feature-Store. Optimiert für Zeitreihendaten.
- Fest-End-to-End Open Source-Funktionen für maschinelles Lernen.
- Feathr - ein Hochleistungsgeschäft mit Unternehmensklassen.
- FeatureForm - Ein virtueller Feature -Store. Verwandeln Sie Ihre vorhandene Dateninfrastruktur in einen Feature -Store.
- Tekton - Eine voll verwaltete Feature -Plattform, die so entwickelt wurde, dass sie den vollständigen Lebenszyklus von Funktionen orchestrieren.
Hyperparameterabstimmung
Werkzeuge und Bibliotheken zur Durchführung einer Hyperparameter -Abstimmung.
- Berater - Open -Source -Implementierung von Google Wesir für Hyperparameter.
- Hyperas - Eine sehr einfache Wrapper für eine bequeme Hyperparameteroptimierung.
- Hyperopt - Verteilte asynchrone Hyperparameteroptimierung in Python.
- Katib - Kubernetes -basiertes System zur Hyperparameter -Abstimmung und der Suche nach neuronalen Architektur.
- Kerastuner-Einfach zu bedienender, skalierbarer Hyperparameteroptimierungsrahmen.
- Optuna - Open Source Hyperparameter -Optimierungsrahmen zur automatisierenden Hyperparameter -Suche.
- SCIKIT -Optimierung - Einfache und effiziente Bibliothek, um teure und laute Schwarzkastenfunktionen zu minimieren.
- Talos - Hyperparameteroptimierung für Tensorflow, Keras und Pytorch.
- Melodie - Python -Bibliothek zur Experimentierung und Hyperparameter -Abstimmung in jeder Skala.
Wissensaustausch
Tools zum Austausch von Wissen an das gesamte Team/Unternehmen.
- Knowledge Repo - Wissensaustauschplattform für Datenwissenschaftler und andere technische Berufe.
- KYSO - Ein Ort für Datenerkenntnisse, damit Ihr gesamtes Team aus Ihren Daten lernen kann.
Maschinelles Lernenplattform
Komplette Lösungen für maschinelles Lernen Plattform.
- AIWARE - AIware hilft MLOPS -Teams, ML -Modelle auszuwerten, bereitzustellen, zu integrieren, zu skalieren und zu überwachen.
- Algorithmie - regeln Ihren maschinellen Lernen mit einem gesunden ML -Lebenszyklus sicher.
- Allegro AI - Transformation ML/DL -Forschung in Produkte. Schneller.
- Bodywork - Bereits maschinelles Lernenprojekte in Python, in Kubernetes, entwickelt.
- CNVRG-Eine End-to-End-Plattform für maschinelles Lernen zum Erstellen und Bereitstellen von KI-Modellen im Maßstab.
- DAGSHUB - Eine Plattform, die auf Open -Source -Tools für Daten, Modell und Pipeline -Management basiert.
- DataIKU - Plattform, der den Zugriff auf Daten demokratisieren und es Unternehmen ermöglichen, ihren eigenen Weg zur KI aufzubauen.
- DATAROBOT-AI-Plattform, die die Datenwissenschaft demokratisiert und die End-to-End-ML in Skala automatisiert.
- Domino - Ein Ort für Ihre Data Science Tools, Apps, Ergebnisse, Modelle und Wissen.
- Randimpulse - Plattform zum Erstellen, Optimieren und Bereitstellen von AI/ML -Algorithmen für Kantengeräte.
- Envd - Umgebung für maschinelles Lernen für die Entwicklung von Datenwissenschaft und KI/ML -Ingenieurteams.
- FEDML - vereinfacht den Workflow des Federated Learning überall in jeder Skala.
- Gradient - Multicloud CI/CD- und MLOPS -Plattform für maschinelle Lernteams.
- H2O - Open -Source -Führer in AI mit der Mission, KI für alle zu demokratisieren.
- Hopsworks - Open -Source -Plattform zum Entwicklung und Betrieb von Modellen für maschinelles Lernen im Maßstab.
- Iguazio-Data Science-Plattform, die Mlops mit End-to-End-Pipelines automatisiert.
- Katonic - Automatisieren Sie Ihren Intelligenzzyklus mit der Katonic Mlops -Plattform.
- Knime - Erstellen und Produktion von Datenwissenschaft mit einer einfachen und intuitiven Umgebung.
- Kubeflow - Bereitstellung von ML -Workflows auf Kubernetes einfach, tragbar und skalierbar.
- Lynxkite - Eine vollständige Plattform für die Data Science -Plattform von Graph Data Science für sehr große Grafiken und andere Datensätze.
- ML Workspace-All-in-One-webbasiertes IDE Spezialisiert für maschinelles Lernen und Datenwissenschaft.
- MLREEF - Open Source MLOPS -Plattform, mit der Sie Ihre ML -Arbeit zusammenarbeiten, reproduzieren und teilen können.
- MODZY - ML -Modelle (maschinelles Lernen) im Unternehmen und am Rande einsetzen, verbinden, ausführen und überwachen.
- Neu.ro-MLOPS-Plattform, die Open-Source- und proprietäre Tools in kundenorientierte Systeme integriert.
- Omnimizer - vereinfacht und beschleunigt Mlops, indem die Lücke zwischen ML -Modellen und Kantenhardware überbrückt.
- Pachyderm-kombiniert die Datenlinie mit End-to-End-Pipelines auf Kubernetes, die für das Unternehmen konstruiert wurden.
- Polyaxon - Eine Plattform für reproduzierbare und skalierbare maschinelle Lernen und tiefes Lernen auf Kubernetes.
- SAGEMAKER - Vollständiger Service, der die Möglichkeit bietet, ML -Modelle schnell zu bauen, zu trainieren und einzusetzen.
- SAS VIYA - Cloud Native KI-, Analytik- und Datenmanagementplattform, die den Lebenszyklus der Analytics unterstützt.
- Sematic-Ein Open-Source-End-to-End-Pipelining-Tool, das in kürzester Zeit vom Laptop-Prototyp zu Wolken wechselt.
- Sigopt - eine Plattform, die es einfach macht, Läufe zu verfolgen, das Training zu visualisieren und die Hyperparameter -Tuning zu skalieren.
- ERFOUNDRY - Eine Cloud -native MLOPS -Plattform über Kubernetes zur Vereinfachung des Trainings und der Dienste von ML -Modellen.
- Valohai - führt Sie von POC zur Produktion und verwaltet das gesamte Modelllebenszyklus.
Model Fairness und Privatsphäre
Tools zur Ausführung von Modell Fairness und Privatsphäre in der Produktion.
- AIF360 - Eine umfassende Reihe von Fairness -Metriken für Datensätze und maschinelles Lernen.
- FAIRLEARN - Ein Python -Paket zur Bewertung und Verbesserung der Fairness maschineller Lernmodelle.
- OPACUS - Eine Bibliothek, die es ermöglicht, Pytorch -Modelle mit unterschiedlicher Privatsphäre zu schulen.
- TensorFlow Privacy - Bibliothek für Schulungsmodelle für maschinelles Lernen mit Datenschutz für Schulungsdaten.
Modellinterpretierbarkeit
Tools zur Ausführung von Modellinterpretierbarkeit/Erklärung.
- Alibi - Open -Source -Python -Bibliothek, die ML -Modellinspektion und -interpretation ermöglicht.
- Captum - Modellinterpretierbarkeit und Verständnis der Bibliothek für Pytorch.
- ELI5 - Python -Paket, mit dem Klassifizierer des maschinellen Lernens debuggen und ihre Vorhersagen erklärt.
- InterpretMl - Ein Toolkit, um das Verständnis von Modellen zu verstehen und verantwortungsbewusstes maschinelles Lernen zu ermöglichen.
- Kalk - Erklären Sie die Vorhersagen eines Klassifikators für maschinelles Lernen.
- Lucid - Sammlung von Infrastruktur und Tools für die Forschung in der Interpretierbarkeit neuronaler Netzwerke.
- Salbei - zur Berechnung der globalen Merkmals Bedeutung mithilfe von Shapley -Werten.
- SHOP - Ein theoretischer Ansatz, der die Ausgabe eines maschinellen Lernmodells erklärt.
Modelllebenszyklus
Tools zum Verwalten des Modelllebenszyklus (Tracking -Experimente, Parameter und Metriken).
- Aeromancy - Ein Rahmen zur Durchführung reproduzierbarer KI und ML für Gewichte und Verzerrungen.
- AIM - Eine super einfache Möglichkeit, 1000er ML -Trainingsläufe aufzunehmen, zu suchen und zu vergleichen.
- Kaskade - Bibliothek von ML -Engineering -Tools für schnelle Prototypen und Experiment -Management.
- COMET - Verfolgen Sie Ihre Datensätze, Codeänderungen, Experimentierverlauf und Modelle.
- Guild AI - Open Source -Experiment -Tracking, Pipeline -Automatisierung und Hyperparameterabstimmung.
- Keepsake - Versionskontrolle für maschinelles Lernen mit Unterstützung für Amazon S3 und Google Cloud Storage.
- Losswise - erleichtert es einfach, den Fortschritt eines maschinellen Lernprojekts zu verfolgen.
- MLFlow - Open Source -Plattform für den Lebenszyklus für maschinelles Lernen.
- ModelDB - Open Source ML Model Versioning, Metadaten und Experimentmanagement.
- Neptune AI - Das leichte Experiment -Management -Tool, das zu jedem Workflow passt.
- Heilig - Ein Werkzeug, mit dem Sie Experimente konfigurieren, organisieren, protokollieren und reproduzieren können.
- Gewichte und Vorurteile - Ein Werkzeug zur Visualisierung und Verfolgung Ihrer Experimente für maschinelles Lernen.
Modelldienste
Werkzeuge zum Servieren von Modellen in der Produktion.
- BANANA - Hostieren Sie Ihren ML -Inferenzcode im serverlosen GPUs und integrieren Sie ihn mit einer Codezeile in Ihre App.
- Strahl - Entwickeln Sie sich auf serverlosen GPUs, bereitstellen hochdarstellende APIs und schnell Prototypen -ML -Modelle.
- Bentoml-Open-Source-Plattform für Hochleistungs-ML-Modell.
- BudgetML - Bereitstellen eines ML -Inferenzdienstes mit einem Budget in weniger als 10 Codezeilen.
- COG-Open-Source-Tool, mit dem Sie ML-Modelle in einem standardmäßigen, produktionsbereiten Container verpacken können.
- Cortex - maschinelles Lernenmodell, das Infrastruktur bedient.
- Geniusrise - Hostinferenz -APIs, Masseninferenz und feiner Melodie -Text, Vision, Audio und multimodale Modelle.
- Gradio - Erstellen Sie anpassbare UI -Komponenten um Ihre Modelle.
- Graphpipe - Modellbereitstellung für maschinelles Lernen einfach gemacht.
- Hydrosphere - Plattform für die Bereitstellung Ihres maschinellen Lernens für die Produktion.
- KFSERVING - Kubernetes benutzerdefinierte Ressourcendefinition zum Servieren von ML -Modellen in willkürlichen Frameworks.
- LOCALAI - Drop -In -Ersatz -REST -API, die mit den OpenAI -API -Spezifikationen für die Inferenz kompatibel ist.
- Merlin - Eine Plattform zum Bereitstellen und Servieren von Modellen für maschinelles Lernen.
- MLEM - Version und Bereitstellung Ihrer ML -Modelle nach Gitops -Prinzipien.
- Opyrator - verwandelt Ihren ML -Code mit Web -API, interaktiver GUI und mehr in Microservices.
- Predictionio - Ereignissammlung, Bereitstellung von Algorithmen, Bewertung, Abfragen von Vorhersageergebnissen über APIs.
- Quix - Serverlose Plattform zum Verarbeiten von Datenströmen in Echtzeit mit maschinellem Lernmodellen.
- Rune - Stellt Container zur Einkapselung und Bereitstellung von Edgeml -Pipelines und -Anwendungen bereit.
- Seldon - Nehmen Sie Ihre ML -Projekte von POC bis zur Produktion mit maximaler Effizienz und minimaler Risiko.
- Mit Streamlit - Erstellen Sie Apps für Ihre ML -Projekte mit täuschend einfachen Python -Skripten.
- Tensorflow Serving - Flexible Hochleistungs -Serviersystem für ML -Modelle, die für die Produktion ausgelegt sind.
- TorchServe - Ein flexibles und einfach zu verwendendes Werkzeug zum Servieren von Pytorch -Modellen.
- Triton Inference Server - Bietet eine optimierte Cloud- und Kantenausführungslösung.
- Vespa - Speichern, suchen, organisieren und machen Sie maschinell gelernte Schlussfolgerungen über Big Data zum Servieren.
- Wallaroo.ai - Eine Plattform zum Bereitstellen, Servieren und Optimieren von ML -Modellen in Cloud- und Kantenumgebungen.
Modelltests und Validierung
Tools zum Testen und Validieren von Modellen.
- DeepChecks - Open -Source -Paket zur Validierung von ML -Modellen und -Daten mit verschiedenen Überprüfungen und Suiten.
- STARWALE - Eine Mlops/LLMOPS -Plattform für Modellbildung, Bewertung und Feinabstimmung.
- Trubriken - Validieren Sie maschinelles Lernen mit Datenwissenschafts- und Domänen -Experten -Feedback.
Optimierungstools
Optimierungstools im Zusammenhang mit Modellskalierbarkeit in der Produktion.
- Beschleunigen-eine einfache Möglichkeit, Pytorch-Modelle mit Multi-GPU, TPU, gemischter Präzision zu trainieren und zu verwenden.
- DASK - Bietet eine erweiterte Parallelität für die Analytik und ermöglicht die Leistung in Skala für die Tools, die Sie lieben.
- DeepSpeed - Deep Learning Optimization Library, die das verteilte Training einfach, effizient und effektiv macht.
- Faser - Python Distributed Computerbibliothek für moderne Computercluster.
- HOROVOD - Verteilte Deep Learning Training Framework für Tensorflow, Keras, Pytorch und Apache MXNET.
- MAHOUT - verteiltes lineares Algebra -Framework und mathematisch ausdrucksstarker Scala DSL.
- MLLIB - Apache Sparks skalierbare Bibliothek für maschinelles Lernen.
- Modin - Beschleunigen Sie Ihre Pandas -Workflows, indem Sie eine einzelne Codezeile ändern.
- Nebullvm-einfach zu bedienende Bibliothek, um eine Inferenz zu steigern.
- NOS - Open -Source -Modul zum Ausführen von KI -Workloads auf Kubernetes auf optimierte Weise.
- Petastorm - Ermöglicht ein einzelnes Maschinen- oder verteilte Schulung und Bewertung von Deep -Learning -Modellen.
- Rapids-gibt die Möglichkeit, End-to-End-Datenwissenschafts- und Analyse-Pipelines vollständig auf GPUs auszuführen.
- Ray - Schneller und einfacher Rahmen für das Erstellen und Ausführen von verteilten Anwendungen.
- Singa - Apache Top Level Project, das sich auf das verteilte Training von DL- und ML -Modellen konzentriert.
- TPOT - automatisiertes ML -Tool, das maschinelle Lernpipelines mithilfe genetischer Programmierung optimiert.
Vereinfachungswerkzeuge
Tools im Zusammenhang mit der Vereinfachung und Standardisierung des maschinellen Lernens.
- Chassis - verwandelt Modelle in ML -freundliche Behälter, die fast überall laufen.
- Hermine - Helfen Sie den Datenwissenschaftlern, auf schnellere und einfachere Weise mehr organisierte Codes einzurichten.
- Hydra - Ein Framework für die elegant konfigurierte Konfiguration komplexer Anwendungen.
- Koalas - Pandas -API auf Apache Spark. Macht Datenwissenschaftler bei der Interaktion mit Big Data produktiver.
- Ludwig - Ermöglicht Benutzern, Deep -Learning -Modelle zu trainieren und zu testen, ohne Code zu schreiben.
- Mlnotify - Sie müssen Ihr Training nicht weiter überprüfen, nur eine Einfuhrlinie, und Sie werden wissen, dass es zweite ist.
- Pycaret - Open Source, Low -Code -Bibliothek für maschinelles Lernen in Python.
- Sagify - Ein CLI -Dienstprogramm zum Training und Bereitstellen von ML/DL -Modellen auf AWS Sagemaker.
- Soopervisor - ML -Projekte exportieren in Kubernetes (Argo -Workflows), Luftstrom, AWS -Batch und Slurm.
- Soorgeon - Umwandle monolithische Jupyter -Notizbücher in wartbare Pipelines.
- Traingenerator - Eine Web -App zum Generieren von Vorlagencode für maschinelles Lernen.
- Turi Create - vereinfacht die Entwicklung von maschinellen Lernmodellen.
Visuelle Analyse und Debugging
Tools zur visuellen Analyse und Debuggen von ML/DL -Modellen.
- Aporia - Beobachtbarkeit mit maßgeschneiderter Überwachung und Erklärung für ML -Modelle.
- ARIZE-Eine kostenlose End-to-End-ML-Beobachtbarkeits- und Modellüberwachungsplattform.
- Offensichtlich - Interaktive Berichte zur Analyse von ML -Modellen während der Validierung oder der Produktionsüberwachung.
- Fiddler - Überwachen, erklären und analysieren Ihre KI in der Produktion.
- Vielfalt - ein Modell -agnostisches visuelles Debugging -Tool für maschinelles Lernen.
- Nannyml - Algorithmus, mit dem die Auswirkungen der Datendrift auf die Leistung vollständig erfasst werden können.
- NETRON - Visualizer für neuronale Netzwerk-, Deep -Learning- und maschinelles Lernmodelle.
- OPIK - LLM -Anwendungen mit einer Reihe von Beobachtbarkeitstools bewerten, testen und versenden.
- Phoenix - MLOPS in einem Notebook zur Fehlerbehebung und feinstimmenden generativen LLM-, CV- und tabellarischen Modellen.
- Radicalbit - Die Open -Source -Lösung zur Überwachung Ihrer KI -Modelle in der Produktion.
- Superweise-Vollautomatisierte Modellbeobachtbarkeit der Unternehmensgrade in einer SaaS-Plattform für Selbstbedienung.
- WhyLogs - Der Open -Source -Standard für die Datenprotokollierung. Ermöglicht die Überwachung und Beobachtbarkeit von ML.
- Yellowbrick - Visuelle Analyse und diagnostische Tools zur Erleichterung des Modells für maschinelles Lernen.
Workflow -Tools
Tools und Frameworks zum Erstellen von Workflows oder Pipelines im Kontext des maschinellen Lernens.
- ARGO - Open Source Container -native Workflow -Engine zum Orchestrieren paralleler Jobs auf Kubernetes.
- AUTOMATE STUDIO - Erstellen und Bereitstellen von AI -betriebenen Workflows.
- Couler - Unified Interface zum Konstruktion und Verwalten von Workflows in verschiedenen Workflow -Motoren.
- DSTACK - Ein Open -Core -Tool zur Automatisierung von Daten und Schulungsworkflows.
- Flyte - Einfach zu erstellen gleichzeitige, skalierbare und wartbare Workflows für maschinelles Lernen.
- HAMILTON - Ein skalierbarer Micro -Framework für allgemeine Zwecke zur Definition von Datenflows.
- Kale - Ziel, die Datenwissenschaftserfahrung der Bereitstellung von Kubeflow -Pipelines -Workflows zu vereinfachen.
- Kedro - Bibliothek, die Software Engineering Best -Practice für Daten- und ML -Pipelines implementiert.
- Luigi - Python -Modul, mit dem Sie komplexe Pipelines von Batch -Jobs aufbauen können.
- METAFLOW - Human -freundliche LiB, die Wissenschaftlern und Ingenieuren hilft, Datenwissenschaftsprojekte aufzubauen und zu verwalten.
- MLRUN - Generischer Mechanismus für Datenwissenschaftler, um ML -Aufgaben und -Pipelines zu erstellen, auszuführen und zu überwachen.
- Orchest - Visual Pipeline Editor und Workflow Orchestrator mit einer einfach zu verwendenden Benutzeroberfläche und basierend auf Kubernetes.
- PLOOMBER - Schreiben Sie Wardierbare, produktionsbereite Pipelines. Entwickeln Sie lokal und stellen Sie in der Cloud bereit.
- Präfekt - Ein Workflow -Management -System, das für die moderne Infrastruktur entwickelt wurde.
- VDP - Ein Open -Source -Tool, mit dem KI für unstrukturierte Daten nahtlos in den modernen Datenstapel integriert werden kann.
- Wordware-Eine Web-veranstaltete IDE, in der nicht-technische Domänenexperten aufgabenspezifische AI-Agenten erstellen können.
- ZENML - Ein erweiterbares Open -Source -Mlops -Framework zum Erstellen reproduzierbarer Pipelines.
Ressourcen
Wo kann man neue Tools entdecken und über vorhandene diskutieren.
Artikel
- Eine Tour durch End-to-End-Plattformen für maschinelles Lernen (Datenbank)
- Kontinuierliche Lieferung für maschinelles Lernen (Martin Fowler)
- Liefern Sie die Vision von MLOPS: Ein reifbasierter Ansatz (Gigaom)
- Operationen für maschinelles Lernen (MLOPS): Überblick, Definition und Architektur (ARXIV)
- MLOPS Roadmap: Ein kompletter MLOPS -Karriereführer (Scaler Blogs)
- MLOPS: kontinuierliche Liefer- und Automatisierungsleitungen im maschinellen Lernen (Google)
- MLOPS: Maschinelles Lernen als technische Disziplin (Medium)
- Regeln des maschinellen Lernens: Best Practices für ML Engineering (Google)
- Der ML -Testwert: Eine Rubrik für die ML -Produktionsbereitschaft und die technische Schuldenreduzierung (Google)
- Was ist Mlops? (Nvidia)
Bücher
- Mlops mit MLFlow (Apress) beginnen
- Gebäude maschinelles Lernen Pipelines (O'Reilly)
- Anwendungen mit maschinellem Lernen bauen (O'Reilly)
- Tiefes Lernen in der Produktion (KI Sommer)
- Entwerfen von maschinellen Lernsystemen (O'Reilly)
- Engineering Mlops (Packt)
- Implementierung von Mlops im Unternehmen (O'Reilly)
- Einführung von Mlops (O'Reilly)
- Kubeflow für maschinelles Lernen (O'Reilly)
- Kubeflow Operations Guide (O'Reilly)
- Entwurfsmuster für maschinelles Lernen (O'Reilly)
- Maschinelles Lernen Engineering in Aktion (Manning)
- ML OPS: Operationalisierung von Datenwissenschaft (O'Reilly)
- Mlops Engineering im Maßstab (Manning)
- Mlops Lifecycle Toolkit (Apress)
- Praktisches tiefes Lernen im Maßstab mit MLFlow (Packt)
- Praktische Mlops (O'Reilly)
- Produktionsbereitete Deep Learning (Packt)
- Zuverlässiges maschinelles Lernen (O'Reilly)
- Das Architektenhandbuch für maschinelles Lernlösungen (Packt)
Ereignisse
- anwenden () - Die ML Data Engineering Conference
- MLOPS -Konferenz - Keynotes und Panels
- Mlops World: Maschinelles Lernen in der Produktionskonferenz
- NormConf - Die Normcore Tech -Konferenz
- Stanford MLSYS -Seminarserie
Andere Listen
- Ml angewendet
- Tolle Automl -Papiere
- Super Automl
- Fantastische Datenwissenschaft
- Tolle Datenops
- Super Deep Learning
- Tolle Spiel Datensätze (enthält KI -Inhalte)
- Fantastisches maschinelles Lernen
- Tolle Mlops
- Fantastisches maschinelles Lernen von Produktion
- Super Python
- Tiefes Lernen in der Produktion
Podcasts
- Wie KI das baute
- Kubernetes -Podcast von Google
- Maschinelles Lernen - Software -Engineering täglich
- Mlops.Community
- Pipeline -Konversation
- Praktische KI: maschinelles Lernen, Datenwissenschaft
- Diese Woche in maschinellem Lernen & KI
- Wahre ML -Gespräche
Locker
- Kubeflow Workspace
- Mlops Community Wokspace
Websites
- Feature Stores für ML
- Mit ml gemacht
- ML-Ops
- MLOPS -Community
- Mlops Guide
- Mlops jetzt
Beitragen
Alle Beiträge sind willkommen! Bitte werfen Sie zuerst die Beitragsrichtlinien an.