Descarga de awesome mlops - Descarga de código fuente awesome mlops

awesome mlops

Otro código fuente

1.0.0

Descargar

Mlops impresionantes

Una lista curada de impresionantes herramientas MLOPS.

Inspirado por Awesome-Python.

Mlops impresionantes
- Automl
- CI/CD para aprendizaje automático
- Monitoreo de trabajo cron
- Catálogo de datos
- Enriquecimiento de datos
- Exploración de datos
- Gestión de datos
- Proceso de datos
- Validación de datos
- Visualización de datos
- Detección de deriva
- Ingeniería de características
- Tienda
- Ajuste de hiperparameter
- Intercambio de conocimientos
- Plataforma de aprendizaje automático
- Modelo de equidad y privacidad
- Interpretabilidad del modelo
- Ciclo de vida del modelo
- Modelo
- Pruebas y validación de modelos
- Herramientas de optimización
- Herramientas de simplificación
- Análisis visual y depuración
- Herramientas de flujo de trabajo
Recursos
- Artículos
- Libros
- Eventos
- Otras listas
- Podcasts
- Flojo
- Sitios web
Que contribuye

Automl

Herramientas para realizar automl.

Autogluon: aprendizaje automático automatizado para imágenes, texto, tabular, series de tiempo y datos multimodales.
Autokeras - El objetivo de Autookeras es hacer que el aprendizaje automático sea accesible para todos.
AutopyTorch - Búsqueda de arquitectura automática y optimización de hiperparameter para Pytorch.
AutoSklearn-Kit automatizado de herramientas de aprendizaje automático y un reemplazo de entrega de un estimador de ciencia ficción.
EvalML: una biblioteca que construye, optimiza y evalúa las tuberías de ML utilizando funciones específicas de dominio.
Flaml: encuentra modelos ML precisos de manera automática, eficiente y económica.
H2O Automl: automatiza el flujo de trabajo ML, que incluye capacitación automática y ajuste de modelos.
MindSDB - Capa de IA para bases de datos que le permite desarrollar, entrenar e implementar modelos ML sin esfuerzo.
MLBOX: MLBox es una potente biblioteca automatizada de aprendizaje automático Python.
Búsqueda de modelos: marco que implementa algoritmos Automl para la búsqueda de arquitectura de modelos a escala.
NNI: un conjunto de herramientas AutomL de código abierto para automatizar el ciclo de vida del aprendizaje automático.

CI/CD para aprendizaje automático

Herramientas para realizar CI/CD para el aprendizaje automático.

CLEARML - CI/CD auto -mágico para optimizar su flujo de trabajo ML.
CML - Biblioteca de código abierto para implementar CI/CD en proyectos de aprendizaje automático.
KITOPS - Proyecto MLOPS de código abierto que facilita las transferencias de modelos entre Data Scientist y DevOps.

Monitoreo de trabajo cron

Herramientas para monitorear trabajos cron (trabajos recurrentes).

Cronitor: monitoree cualquier trabajo cron o tarea programada.
HealthChecksio: monitoreo de trabajo de Cron simple y efectivo.

Catálogo de datos

Herramientas para la catalogación de datos.

Amundsen: descubrimiento de datos y motor de metadatos para mejorar la productividad al interactuar con los datos.
Apache Atlas: proporciona capacidades de gestión y gobernanza de metadatos abiertos para construir un catálogo de datos.
CKAN - DMS de código abierto (sistema de gestión de datos) para alimentar centros de datos y portales de datos.
Datahub: la herramienta de búsqueda y descubrimiento de metadatos generalizados de LinkedIn.
MAGDA: un catálogo de datos de código abierto federado para todos sus big data y datos pequeños.
Metacat - Servicio de API de exploración de metadatos unificados para Hive, RDS, Teradata, Redshift, S3 y Cassandra.
OpenMetadata: un solo lugar para descubrir, colaborar y obtener sus datos correctos.

Enriquecimiento de datos

Herramientas y bibliotecas para enriquecimiento de datos.

Snorkel: un sistema para generar rápidamente datos de entrenamiento con supervisión débil.
UPGINI: enriquece conjuntos de datos de capacitación con características de fuentes de datos públicas y comunitarias compartidas.

Exploración de datos

Herramientas para realizar la exploración de datos.

Apache Zeppelin: habilita el análisis de datos interactivos basados en datos y documentos de colaboración.
Bamboolib: una GUI intuitiva para Pandas Dataframes.
DataPrep: recopile, limpie y visualice sus datos en Python.
Google Colab - Servicio de cuaderno Jupyter alojado que no requiere configuración para usar.
Notebook Jupyter - entorno de cuaderno basado en la web para informática interactiva.
JUPYTERLAB - La interfaz de usuario de próxima generación para Project Jupyter.
JupyText - Jupyter Notebooks como Documentos de Markdown, Julia, Python o R Scripts.
Perfil de pandas: cree informes de perfil HTML a partir de objetos PANDAS DataFrame.
Polynote: el cuaderno Polyglot con soporte de Scala de primera clase.

Gestión de datos

Herramientas para realizar la gestión de datos.

Arrikto - Almacenamiento ultra rápido y simple para el mundo híbrido de Kubernetes.
Blazingsql: un motor SQL liviano, GPU acelerado y SQL para Python. Construido sobre rápidos CUDF.
Delta Lake: capa de almacenamiento que trae transacciones escalables y ácidas a Apache Spark y otros motores.
DOLT - Base de datos SQL que puede bifurcar, clonar, ramificar, fusionar, empujar y tirar como un repositorio Git.
DUD: una herramienta CLI liviana para versiones de versiones junto con el código fuente y la construcción de tuberías de datos.
DVC: administración y versiones de conjuntos de datos y modelos de aprendizaje automático.
GIT LFS: una extensión de Git de código abierto para versiones de archivos grandes.
HUB: un formato de conjunto de datos para crear, almacenar y colaborar en conjuntos de datos de IA de cualquier tamaño.
Ingesta: un conjunto liviano de herramientas para cargar y compartir datos en proyectos de ciencia de datos.
Lakefs: lago de datos repetible, atómico y versionado en la parte superior del almacenamiento de objetos.
Márquez: recopile, agregue y visualice los metadatos de un ecosistema de datos.
MILVUS: un motor de búsqueda de similitud vectorial de incrustación de código abierto impulsado por FAISS, NMSLIB y MOLOR.
Pinecone: búsqueda de similitud vectorial administrada y distribuida utilizada con un SDK ligero.
QDRANT: un motor de búsqueda de similitud vectorial de código abierto con soporte de filtrado extendido.
Edredón: un centro de datos autoorganizando con soporte S3.

Proceso de datos

Herramientas relacionadas con el procesamiento de datos y las tuberías de datos.

Airflow: plataforma para autor, programar y monitorear programáticamente los flujos de trabajo.
Azkaban - Programador de trabajo de flujo de trabajo por lotes creado en LinkedIn para ejecutar trabajos de Hadoop.
Dagster: un orquestador de datos para aprendizaje automático, análisis y ETL.
Hadoop: marco que permite el procesamiento distribuido de grandes conjuntos de datos en grupos.
Openrefine: herramienta eléctrica para trabajar con datos desordenados y mejorarlos.
Spark - Motor de análisis unificado para procesamiento de datos a gran escala.

Validación de datos

Herramientas relacionadas con la validación de datos.

Cerberus - Biblioteca de validación de datos ligera y extensible para Python.
CleanLab-Biblioteca de Python para AI centrada en datos y aprendizaje automático con datos y etiquetas desordenados del mundo real.
Grandes expectativas: un marco de validación de datos de Python que permite probar sus datos contra conjuntos de datos.
JSON Schema: un vocabulario que le permite anotar y validar los documentos JSON.
TFDV: una biblioteca para explorar y validar datos de aprendizaje automático.

Visualización de datos

Herramientas para visualización de datos, informes y paneles.

Conteo-Herramienta de consulta y visualización SQL/Drag-and-Drop basada en cuadernos.
Dash - Aplicaciones web analíticas para Python, R, Julia y Jupyter.
Data Studio: solución de informes para usuarios avanzados que desean ir más allá de los datos y los paneles de GA.
Facetas: visualizaciones para comprender y analizar conjuntos de datos de aprendizaje automático.
Grafana - Análisis de código abierto multiplataforma y aplicación web de visualización interactiva.
Lux: exploración de datos rápida y fácil al automatizar el proceso de visualización y análisis de datos.
Metabase: la forma más simple y más rápida de llevar la inteligencia y el análisis de negocios a todos.
Redash: conéctese a cualquier fuente de datos, visualice fácilmente el tablero y comparta sus datos.
SOLIDUI - Plataforma de prototipos y edición de visualización generada por IA, soporte de modelos 2D y 3D.
Superset - Aplicación moderna de Inteligencia de Empresas de Inteligencia de Empresa, lista para la empresa.
Tableau: herramienta de visualización de datos poderosa y de más rápido crecimiento utilizada en la industria de la inteligencia empresarial.

Detección de deriva

Herramientas y bibliotecas relacionadas con la detección de deriva.

Alibi Detect: una biblioteca de Python de código abierto se centró en la detección atípica, adversaria y deriva.
Frouros: una biblioteca de Python de código abierto para la detección de deriva en sistemas de aprendizaje automático.
Torchdrift: una biblioteca de deriva de datos y concepto para Pytorch.

Ingeniería de características

Herramientas y bibliotecas relacionadas con la ingeniería de características.

Motor de características: paquete de ingeniería de características con funcionalidad similar a Sklearn.
FeatRetools - Biblioteca de Python para ingeniería de características automatizadas.
TSFRESH - Biblioteca de Python para la extracción automática de características relevantes de series de tiempo.

Tienda

Herramientas de almacenamiento de funciones para servicio de datos.

Butterfree: una herramienta para construir tiendas. Transforme sus datos sin procesar en características hermosas.
Bytehub: una tienda de funciones fácil de usar. Optimizado para datos de series de tiempo.
Fiesta-Tienda de funciones de código abierto de extremo a extremo para el aprendizaje automático.
Feathr: una tienda de funciones de alto rendimiento de grado empresarial.
FuncionForm: una tienda de funciones virtuales. Convierta su infraestructura de datos existente en una tienda de características.
Tecton: una plataforma de características totalmente administrada construida para orquestar el ciclo de vida completo de las características.

Ajuste de hiperparameter

Herramientas y bibliotecas para realizar un ajuste de hiperparameter.

Asesor: implementación de código abierto de Google Vizier para la sintonización de los parámetros de los hiper.
Hyperas: un envoltorio muy simple para una conveniente optimización de hiperparameter.
Hypertopt - Optimización de hiperparámetro asincrónico distribuido en Python.
KATIB - Sistema basado en Kubernetes para ajuste de hiperparameter y búsqueda de arquitectura neural.
KERASTUNER-Marco de optimización de hiperparameter escalable fácil de usar.
Optuna: marco de optimización de hiperparameter de código abierto para automatizar la búsqueda de hiperparameter.
SCIKIT Optimize: biblioteca simple y eficiente para minimizar las funciones costosas y ruidosas de caja negra.
Talos - Optimización de hiperparameter para TensorFlow, Keras y Pytorch.
Tune - Biblioteca de Python para la ejecución del experimento y el ajuste del hiperparámetro a cualquier escala.

Intercambio de conocimientos

Herramientas para compartir conocimiento a todo el equipo/empresa.

Repo de conocimiento: plataforma de intercambio de conocimientos para científicos de datos y otras profesiones técnicas.
KYSO: un lugar para información de datos para que todo su equipo pueda aprender de sus datos.

Plataforma de aprendizaje automático

Soluciones completas de la plataforma de aprendizaje automático.

AIWare: AIWare ayuda a los equipos de MLOPS a evaluar, implementar, integrar, escalar y monitorear modelos ML.
Algoritmia: regida de forma segura sus operaciones de aprendizaje automático con un ciclo de vida de ML saludable.
Allegro AI - Transformar la investigación ML/DL en productos. Más rápido.
Bodywork: implementa proyectos de aprendizaje automático desarrollados en Python, a Kubernetes.
CNVRG: una plataforma de aprendizaje automático de extremo a extremo para construir e implementar modelos AI a escala.
DagShub: una plataforma construida sobre herramientas de código abierto para datos, modelo y gestión de tuberías.
DataKu: plataforma democratizando el acceso a los datos y permitiendo a las empresas construir su propio camino hacia la IA.
Datarobot: plataforma AI que democratiza la ciencia de datos y automatiza el ML de extremo a extremo a escala.
Domino: un lugar para sus herramientas de ciencia de datos, aplicaciones, resultados, modelos y conocimiento.
Impulso de borde: plataforma para crear, optimizar e implementar algoritmos AI/ML para dispositivos Edge.
ENVD - Entorno de desarrollo de aprendizaje automático para la ciencia de datos y los equipos de ingeniería de IA/ML.
FEDML: simplifica el flujo de trabajo del aprendizaje federado en cualquier lugar a cualquier escala.
Gradiente: plataforma multicloud CI/CD y MLOPS para equipos de aprendizaje automático.
H2O - Líder de código abierto en IA con la misión de democratizar la IA para todos.
Hopsworks: plataforma de código abierto para desarrollar y operar modelos de aprendizaje automático a escala.
Iguazio: plataforma de ciencia de datos que automatiza MLOP con tuberías de aprendizaje automático de extremo a extremo.
Katonic: automatice su ciclo de inteligencia con la plataforma Katonic MLOPS.
Knime: cree y produce ciencia de datos utilizando un entorno fácil e intuitivo.
Kubeflow - Hacer implementaciones de flujos de trabajo ML en Kubernetes simples, portátiles y escalables.
Lynxkite: una plataforma completa de ciencia de datos de gráficos para gráficos muy grandes y otros conjuntos de datos.
ML Workspace: IDE basado en la web todo en uno especializado para aprendizaje automático y ciencia de datos.
Mlreef: plataforma MLOPS de código abierto que lo ayuda a colaborar, reproducir y compartir su trabajo de ML.
Modzy: implementar, conectar, ejecutar y monitorear los modelos de aprendizaje automático (ML) en la empresa y en el borde.
NEU.RO-Plataforma MLOPS que integra herramientas de código abierto y patentado en sistemas orientados al cliente.
Omnimizer: simplifica y acelera MLOPS uniendo la brecha entre los modelos ML y el hardware de borde.
Pachyderm: combina el linaje de datos con tuberías de extremo a extremo en Kubernetes, diseñados para la empresa.
Polyaxon: una plataforma para el aprendizaje automático reproducible y escalable y el aprendizaje profundo en Kubernetes.
Sagemaker: servicio totalmente administrado que brinda la capacidad de construir, entrenar e implementar modelos ML rápidamente.
SAS VIYA - Plataforma de gestión de datos y IA nativa de Cloud Native que admite el ciclo de vida analítico.
Semático: una herramienta de tuberías de extremo a extremo de código abierto para pasar del prototipo de la computadora portátil a la nube en poco tiempo.
SIGOPT: una plataforma que facilita el seguimiento de las ejecuciones, visualizar el entrenamiento y el ajuste de los hiperparameter de escala.
TrueFoundry: una plataforma MLOPS nativa de nube sobre Kubernetes para simplificar la capacitación y la entrega de modelos ML.
Valohai: lo lleva de POC a la producción mientras se gestiona todo el ciclo de vida del modelo.

Modelo de equidad y privacidad

Herramientas para realizar la justicia y la privacidad de los modelos en la producción.

AIF360: un conjunto integral de métricas de equidad para conjuntos de datos y modelos de aprendizaje automático.
Fairlearn: un paquete de Python para evaluar y mejorar la equidad de los modelos de aprendizaje automático.
OPACUS: una biblioteca que permite capacitar a los modelos Pytorch con privacidad diferencial.
TensorFlow Privacy - Biblioteca para capacitar modelos de aprendizaje automático con privacidad para datos de capacitación.

Interpretabilidad del modelo

Herramientas para realizar la interpretabilidad del modelo/explicación.

ALIBI - Biblioteca Python de código abierto que permite la inspección e interpretación del modelo ML.
CAPTUM - Interpretabilidad del modelo y comprensión de la biblioteca para Pytorch.
ELI5 - Paquete Python que ayuda a depurar clasificadores de aprendizaje automático y explicar sus predicciones.
InterpretML: un conjunto de herramientas para ayudar a comprender los modelos y habilitar el aprendizaje automático responsable.
Lime: explicando las predicciones de cualquier clasificador de aprendizaje automático.
Lucid - Colección de infraestructura y herramientas para la investigación en la interpretabilidad de las redes neuronales.
SAGE: para calcular la importancia de la característica global utilizando valores de Shapley.
SHAP: un enfoque teórico del juego para explicar la salida de cualquier modelo de aprendizaje automático.

Ciclo de vida del modelo

Herramientas para administrar el ciclo de vida del modelo (experimentos de seguimiento, parámetros y métricas).

Aeromancia: un marco para realizar IA y ML reproducibles para pesos y sesgos.
Objetivo: una forma súper fácil de registrar, buscar y comparar 1000s de ML de entrenamiento.
Cascade - Biblioteca de herramientas de ingeniería ML para prototipos rápidos y gestión de experimentos.
Comet: rastrea tus conjuntos de datos, cambios en el código, historial de experimentación y modelos.
Guild AI - Seguimiento de experimentos de código abierto, automatización de tuberías y ajuste de hiperparameter.
Recuerdo: control de versiones para el aprendizaje automático con soporte para Amazon S3 y Google Cloud Storage.
Fastalwise: facilita el seguimiento del progreso de un proyecto de aprendizaje automático.
MLFLOW - Plataforma de código abierto para el ciclo de vida del aprendizaje automático.
ModelDB - Versión de modelo ML de código abierto, metadatos y gestión de experimentos.
Neptune AI: la herramienta de gestión de experimentos más liviana que se ajusta a cualquier flujo de trabajo.
Sagrado: una herramienta para ayudarlo a configurar, organizar, registrar y reproducir experimentos.
Pesos y sesgos: una herramienta para visualizar y rastrear sus experimentos de aprendizaje automático.

Modelo

Herramientas para servir modelos en producción.

Banana: aloje su código de inferencia ML en GPU sin servidor e integre en su aplicación con una línea de código.
Beam: desarrollar en GPU sin servidor, implementar API de alto rendimiento y prototipos de modelos ML rápidamente.
Bentoml-Plataforma de código abierto para servicio de modelo ML de alto rendimiento.
Presupuesto de presupuesto: implementa un servicio de inferencia ML en un presupuesto en menos de 10 líneas de código.
COG: herramienta de código abierto que le permite empaquetar modelos ML en un contenedor estándar listo para la producción.
Cortex - Infraestructura de servicio de modelo de aprendizaje automático.
GeniusRise: API de inferencia de host, inferencia a granel y texto de ajuste, visión, audio y modelos multimodales.
Gradio: cree componentes de UI personalizables en torno a sus modelos.
GraphPipe - Implementación del modelo de aprendizaje automático simplificado.
Hidrosfera: plataforma para implementar su aprendizaje automático a la producción.
KFSERVING - Definición de recursos personalizados de Kubernetes para servir modelos ML en marcos arbitrarios.
Localai - API REST de reemplazo de entrega que es compatible con las especificaciones de API de OpenAI para la inferencia.
Merlín: una plataforma para implementar y servir modelos de aprendizaje automático.
MLEM - Versión e implementar sus modelos ML siguiendo los principios de GITOPS.
Opyrator: convierte su código ML en microservicios con API web, GUI interactiva y más.
Predicción: recopilación de eventos, despliegue de algoritmos, evaluación, consulta de resultados predictivos a través de API.
Quix: plataforma sin servidor para procesar flujos de datos en tiempo real con modelos de aprendizaje automático.
Rune: proporciona contenedores para encapsular e implementar tuberías y aplicaciones de EDGEML.
SELDON - Lleve sus proyectos de ML de POC a producción con máxima eficiencia y riesgo mínimo.
Streamlit: le permite crear aplicaciones para sus proyectos ML con scripts de Python engañosamente simples.
TensorFlow Serving: sistema flexible de servicio de alto rendimiento para modelos ML, diseñado para la producción.
Torchserve: una herramienta flexible y fácil de usar para servir modelos Pytorch.
Triton Inference Server: proporciona una solución optimizada de inferencia de nubes y borde.
Vespa: almacene, busque, organice y realice inferencias aprendidas a máquina sobre big data en el momento de la entrega.
Wallaroo.ai: una plataforma para implementar, servir y optimizar modelos ML en entornos de nubes y borde.

Pruebas y validación de modelos

Herramientas para probar y validar modelos.

Deepchecks: paquete de código abierto para validar modelos y datos ML, con varias comprobaciones y suites.
Starwhale: una plataforma MLOPS/LLMOPS para la construcción de modelos, la evaluación y el ajuste fino.
Trubrics: valida el aprendizaje automático con ciencia de datos y comentarios de expertos en dominios.

Herramientas de optimización

Herramientas de optimización relacionadas con la escalabilidad del modelo en la producción.

Acelerar: una forma simple de entrenar y usar modelos Pytorch con multi-GPU, TPU, precisión mixta.
DASK: proporciona un paralelismo avanzado para el análisis, lo que permite el rendimiento a escala para las herramientas que amas.
Deepeed - Biblioteca de optimización de aprendizaje profundo que hace que la capacitación distribuida sea fácil, eficiente y efectiva.
Fibra - Biblioteca de computación distribuida de Python para grupos de computadora modernos.
Horovod - Marco de capacitación de aprendizaje profundo distribuido para TensorFlow, Keras, Pytorch y Apache MXNet.
Mahout - Marco de álgebra lineal distribuido y matemáticamente expresiva Scala DSL.
MLLIB - Biblioteca de aprendizaje automático escalable de Apache Spark.
Modin: acelere sus flujos de trabajo Pandas cambiando una sola línea de código.
Nebullvm-Biblioteca fácil de usar para impulsar la inferencia de IA.
NOS - Módulo de código abierto para ejecutar cargas de trabajo de IA en Kubernetes de manera optimizada.
Petastorm: permite capacitación y evaluación de una sola máquina o distribuida de modelos de aprendizaje profundo.
Rapids: brinda la capacidad de ejecutar tuberías de ciencia de datos y análisis de extremo a extremo por completo en GPU.
Ray - Marco rápido y simple para construir y ejecutar aplicaciones distribuidas.
SINGA - Proyecto de nivel superior de Apache, centrándose en la capacitación distribuida de modelos DL y ML.
TPOT: herramienta ML automatizada que optimiza las tuberías de aprendizaje automático utilizando la programación genética.

Herramientas de simplificación

Herramientas relacionadas con la simplificación y estandarización del aprendizaje automático.

Chasis: convierte los modelos en contenedores amigables con ML que se ejecutan en casi cualquier lugar.
Hermione: ayuda a los científicos de datos a establecer códigos más organizados, de una manera más rápida y simple.
Hydra: un marco para configurar elegantemente aplicaciones complejas.
Koalas - API Pandas en Apache Spark. Hace que los científicos de datos sean más productivos al interactuar con Big Data.
Ludwig: permite a los usuarios entrenar y probar modelos de aprendizaje profundo sin la necesidad de escribir código.
Mlnotify: no es necesario seguir revisando su entrenamiento, solo una línea de importación y sabrá el segundo que está hecho.
Pycaret: código abierto, biblioteca de aprendizaje automático de bajo código en Python.
Sagify: una utilidad CLI para entrenar e implementar modelos ML/DL en AWS Sagemaker.
SOOPERVISOR - Exportar proyectos de ML a Kubernetes (flujos de trabajo ARGO), flujo de aire, AWS Batch y Slurm.
SOORGEON - Convierta los cuadernos monolíticos Jupyter en tuberías mantenibles.
TrainGenerator: una aplicación web para generar código de plantilla para el aprendizaje automático.
Turi Create: simplifica el desarrollo de modelos de aprendizaje automático personalizados.

Análisis visual y depuración

Herramientas para realizar análisis visuales y depuración de modelos ML/DL.

APORIA: observabilidad con monitoreo personalizado y explicación para modelos ML.
ARIZE: una plataforma de monitoreo de modelos y observabilidad de extremo a extremo gratuita.
Evidentemente, informes interactivos para analizar modelos ML durante la validación o el monitoreo de la producción.
Fiddler: monitoree, explique y analice su IA en producción.
Manifold: una herramienta de depuración visual agnóstica del modelo para el aprendizaje automático.
NANNYML - Algoritmo capaz de capturar completamente el impacto de la deriva de los datos en el rendimiento.
Netron - Visualizador para modelos de redes neuronales, aprendizaje profundo y aprendizaje automático.
OPIK: evalúe, pruebe y envíe aplicaciones LLM con un conjunto de herramientas de observabilidad.
Phoenix: MLOPS en un cuaderno para solucionar problemas de problemas generativos, CV y modelos tabulares.
Radicalbit: la solución de código abierto para monitorear sus modelos de IA en producción.
Superwise: observabilidad del modelo de grado empresarial totalmente automatizado en una plataforma SaaS de autoservicio.
WhyLogs: el estándar de código abierto para el registro de datos. Habilita el monitoreo y la observabilidad de ML.
Yellowbrick: análisis visual y herramientas de diagnóstico para facilitar la selección del modelo de aprendizaje automático.

Herramientas de flujo de trabajo

Herramientas y marcos para crear flujos de trabajo o tuberías en el contexto de aprendizaje automático.

Argo: motor de flujo de trabajo nativo de contenedor de código abierto para orquestar trabajos paralelos en Kubernetes.
Automatice Studio: construya e implementa rápidamente flujos de trabajo propulsados por IA.
Couler: interfaz unificada para construir y administrar flujos de trabajo en diferentes motores de flujo de trabajo.
DSTACK: una herramienta de núcleo abierto para automatizar los datos de datos y los flujos de trabajo de capacitación.
Flyte: fácil de crear flujos de trabajo concurrentes, escalables y mantenibles para el aprendizaje automático.
Hamilton: un micro -marco de uso general escalable para definir flujos de datos.
Kale: tiene como objetivo simplificar la experiencia de ciencia de datos de implementar flujos de trabajo Kubeflow Pipelines.
KEDRO - Biblioteca que implementa la ingeniería de software Mejor práctica para datos y tuberías de ML.
Luigi - Módulo Python que te ayuda a construir tuberías complejas de trabajos por lotes.
Metaflow - LIB amigable para los humanos que ayuda a los científicos e ingenieros a construir y administrar proyectos de ciencia de datos.
Mlrun: mecanismo genérico para que los científicos de datos construyan, ejecuten y monitoreen tareas y tuberías de ML.
Orchest: editor de tuberías visuales y orquestador de flujo de trabajo con una interfaz de usuario fácil de usar y basada en Kubernetes.
Ploomber: escriba tuberías mantenibles y listas para la producción. Desarrollar localmente, implementar en la nube.
Prefecto: un sistema de gestión de flujo de trabajo, diseñado para la infraestructura moderna.
VDP: una herramienta de código abierto para integrar perfectamente la IA para los datos no estructurados en la pila de datos moderna.
Wordware: un IDE alojado en la web donde los expertos en dominios no técnicos pueden construir agentes de IA específicos de tareas.
ZenML: un marco MLOPS de código abierto extensible para crear tuberías reproducibles.

Recursos

Dónde descubrir nuevas herramientas y discutir sobre las existentes.

Artículos

Un recorrido por las plataformas de aprendizaje automático de extremo a extremo (DataBaseline)
Entrega continua para el aprendizaje automático (Martin Fowler)
Entregando la visión de MLOP: un enfoque basado en la madurez (Gigaom)
Operaciones de aprendizaje automático (MLOPS): descripción general, definición y arquitectura (ARXIV)
MLOPS Roadmap: una guía de carrera completa de MLOPS (blogs escaladores)
MLOPS: tuberías continuas de entrega y automatización en el aprendizaje automático (Google)
MLOPS: Aprendizaje automático como disciplina de ingeniería (medio)
Reglas de aprendizaje automático: mejores prácticas para ML Ingeniería (Google)
El puntaje de prueba ML: una rúbrica para la preparación de la producción de ML y la reducción de la deuda técnica (Google)
¿Qué son MLOPS? (Nvidia)