Mlops incríveis
Uma lista com curadoria de ferramentas incríveis do MLOPS.
Inspirado no Awesome-Python.
- Mlops incríveis
- Automl
- CI/CD para aprendizado de máquina
- Monitoramento de empregos de Cron
- Catálogo de dados
- Enriquecimento de dados
- Exploração de dados
- Gerenciamento de dados
- Processamento de dados
- Validação de dados
- Visualização de dados
- Detecção de deriva
- Engenharia de recursos
- Loja de recursos
- Ajuste hiperparâmetro
- Compartilhamento de conhecimento
- Plataforma de aprendizado de máquina
- Modelo de justiça e privacidade
- Interpretabilidade do modelo
- Ciclo de vida do modelo
- Modelo Serviço
- Teste de modelo e validação
- Ferramentas de otimização
- Ferramentas de simplificação
- Análise visual e depuração
- Ferramentas de fluxo de trabalho
- Recursos
- Artigos
- Livros
- Eventos
- Outras listas
- Podcasts
- Folga
- Sites
- Contribuindo
Automl
Ferramentas para executar o Automl.
- AutoGluon-Aprendizado de máquina automatizado para dados de imagem, texto, tabular, séries temporais e multimodais.
- Autokeras - O objetivo do Autokeras é tornar o aprendizado de máquina acessível para todos.
- Autopytorch - Pesquisa de arquitetura automática e otimização de hiperparâmetro para Pytorch.
- AutoSklearn-Kit de ferramentas de aprendizado de máquina automatizado e uma substituição de drop-in para um estimador Scikit-Learn.
- Evalml - Uma biblioteca que constrói, otimiza e avalia pipelines ML usando funções específicas de domínio.
- Flaml - encontra modelos precisos de ML automaticamente, eficiente e economicamente.
- H2O Automl - automatiza o fluxo de trabalho da ML, que inclui treinamento automático e ajuste de modelos.
- MINDSDB - Camada AI para bancos de dados que permitem desenvolver, treinar e implantar modelos ML sem esforço.
- MLBOX - MLBOX é uma poderosa biblioteca de aprendizado de máquina automatizado.
- Pesquisa de modelo - estrutura que implementa algoritmos de automl para pesquisa de arquitetura de modelo em escala.
- NNI - Um kit de ferramentas de automóvel de código aberto para automatizar o ciclo de vida do aprendizado de máquina.
CI/CD para aprendizado de máquina
Ferramentas para executar CI/CD para aprendizado de máquina.
- ClearML - CI/CD auto -mágico para otimizar seu fluxo de trabalho ML.
- CML - Biblioteca de código aberto para implementar o CI/CD em projetos de aprendizado de máquina.
- KITOPS - Projeto MLOPS de código aberto que facilita as transferências do modelo entre cientista de dados e DevOps.
Monitoramento de empregos de Cron
Ferramentas para monitorar trabalhos cron (trabalhos recorrentes).
- Cronitor - Monitore qualquer trabalho cron ou tarefa programada.
- HealthChecksio - Monitoramento de empregos Cron simples e eficaz.
Catálogo de dados
Ferramentas para catalogação de dados.
- Amundsen - Descoberta de dados e mecanismo de metadados para melhorar a produtividade ao interagir com os dados.
- Apache Atlas - fornece recursos de gerenciamento e governança de metadados abertos para criar um catálogo de dados.
- CKAN - DMS de código aberto (sistema de gerenciamento de dados) para alimentar hubs de dados e portais de dados.
- DataHub - Ferramenta de pesquisa e descoberta de metadados generalizados do LinkedIn.
- Magda - Um catálogo de dados federado e de código aberto para todos os seus big data e pequenos dados.
- Metacat - Serviço de API de exploração de metadados unificados para Hive, RDS, Teradata, Redshift, S3 e Cassandra.
- OpenMetadata - um único local para descobrir, colaborar e acertar seus dados.
Enriquecimento de dados
Ferramentas e bibliotecas para enriquecimento de dados.
- Snorkel - Um sistema para gerar rapidamente dados de treinamento com supervisão fraca.
- UPGINI - Enriquece conjuntos de dados de treinamento com recursos de fontes de dados compartilhadas públicas e comunitárias.
Exploração de dados
Ferramentas para executar a exploração de dados.
- Apache Zeppelin - Ativa a análise de dados interativa orientada a dados e documentos colaborativos.
- BAMBOOLIB - Uma GUI intuitiva para quadros de dados de pandas.
- DataPrep - Colete, limpe e visualize seus dados no Python.
- Google Colab - Serviço de notebook Jupyter hospedado que não requer configuração para usar.
- Jupyter Notebook - ambiente de notebook baseado na Web para computação interativa.
- Jupyterlab - A interface de usuário da próxima geração do Project Jupyter.
- JupyText - Jupyter Notebooks como documentos de Markdown, Julia, Python ou R Scripts.
- Profiling Pandas - Crie relatórios de criação de perfil HTML a partir de objetos do Pandas DataFrame.
- Polynote - o notebook poliglot com suporte de Scala de primeira classe.
Gerenciamento de dados
Ferramentas para executar o gerenciamento de dados.
- ARRIKTO - Morto de armazenamento simples e ultra rápido para o mundo híbrido de Kubernetes.
- Blazingsql - um mecanismo leve e acelerado da GPU, SQL para Python. Construído no Rapids CUDF.
- Camada de armazenamento do lago Delta que traz transações ácidas escaláveis ao Apache Spark e outros motores.
- DOLT - Banco de dados SQL que você pode gastar, clone, ramificar, mesclar, empurrar e puxar como um repositório Git.
- DUD - Uma ferramenta cli leve para versões de versão ao lado do código -fonte e da criação de pipelines de dados.
- DVC - Gerenciamento e versão de conjuntos de dados e modelos de aprendizado de máquina.
- Git LFS - Uma extensão Git de código aberto para versões de arquivos grandes.
- Hub - Um formato de conjunto de dados para criar, armazenar e colaborar nos conjuntos de dados de AI de qualquer tamanho.
- Ingestão - Um conjunto leve de ferramentas para carregar e compartilhar dados em projetos de ciência de dados.
- Lakefs - Data Lake repetível, atômico e de versão em cima do armazenamento de objetos.
- Marquez - Colete, agregue e visualize os metadados de um ecossistema de dados.
- MILVUS - Um mecanismo de busca de similaridade vetorial de incorporação de código aberto, alimentado por FAISS, NMSLIB e Irrive.
- Pinecone - Pesquisa de similaridade vetorial gerenciada e distribuída usada com um SDK leve.
- QDRANT - Um mecanismo de pesquisa de similaridade de vetores de código aberto com suporte de filtragem estendido.
- Quilt - Um hub de dados auto -organizados com suporte S3.
Processamento de dados
Ferramentas relacionadas ao processamento de dados e pipelines de dados.
- Airflow - Plataforma para criar, agendar e monitorar programaticamente fluxos de trabalho.
- Azkaban - O agendador de trabalhos de fluxo de trabalho em lote criado no LinkedIn para administrar empregos no Hadoop.
- Dagster - Um orquestrador de dados para aprendizado de máquina, análise e ETL.
- Hadoop - estrutura que permite o processamento distribuído de grandes conjuntos de dados em clusters.
- OpenRefine - ferramenta elétrica para trabalhar com dados confusos e melhorá -los.
- Spark - Unified Analytics Engine para processamento de dados em larga escala.
Validação de dados
Ferramentas relacionadas à validação de dados.
- Cerberus - Biblioteca de validação de dados leve e extensível para Python.
- CleanLab-Biblioteca Python para AI centrada em dados e aprendizado de máquina com dados e etiquetas bagunçados do mundo real.
- Grandes expectativas - uma estrutura de validação de dados Python que permite testar seus dados contra conjuntos de dados.
- JSON Schema - Um vocabulário que permite anotar e validar documentos JSON.
- TFDV - Uma biblioteca para explorar e validar dados de aprendizado de máquina.
Visualização de dados
Ferramentas para visualização de dados, relatórios e painéis.
- Conte-Ferramenta de consulta e visualização SQL/Drag-and-Drop, com base em notebooks.
- Dash - Aplicativos da Web analítica para Python, R, Julia e Jupyter.
- Data Studio - Solução de relatórios para usuários de energia que desejam ir além dos dados e painéis do GA.
- FACETAS - Visualizações para entender e analisar conjuntos de dados de aprendizado de máquina.
- Grafana - Análise de código aberto de várias plataformas e aplicativo da Web de visualização interativa.
- Lux - Exploração de dados rápida e fácil, automatizando o processo de visualização e análise de dados.
- Metabase - A maneira mais simples e rápida de obter inteligência de negócios e análise para todos.
- Redash - Conecte -se a qualquer fonte de dados, visualize facilmente, painel e compartilhe seus dados.
- Solidui - A plataforma de prototipagem e edição de visualização gerada pela AI, suporta modelos 2D e 3D.
- Superset - Aplicativo da Web moderno e pronto para empresas.
- Tableau - Ferramenta de visualização de dados poderosa e de crescimento mais rápido usado na indústria de inteligência de negócios.
Detecção de deriva
Ferramentas e bibliotecas relacionadas à detecção de deriva.
- Alibi Detect - Uma biblioteca Python de código aberto focado na detecção de extinção, adversário e deriva.
- FROUROS - Uma biblioteca Python de código aberto para detecção de deriva em sistemas de aprendizado de máquina.
- TORCHDRIFT - Uma biblioteca de deriva de dados e conceito para Pytorch.
Engenharia de recursos
Ferramentas e bibliotecas relacionadas à engenharia de recursos.
- MOTOR DE RECURSO - Pacote de engenharia de recursos com funcionalidade Sklearn.
- FeedureTools - Biblioteca Python para engenharia automatizada de recursos.
- TSFRESH - Biblioteca Python para extração automática de recursos relevantes de séries temporais.
Loja de recursos
Ferramentas de armazenamento de recursos para serviço de dados.
- Butterfree - Uma ferramenta para construir lojas de recursos. Transforme seus dados brutos em belos recursos.
- BYTEHUB-Uma loja de recursos fácil de usar. Otimizado para dados de séries temporais.
- FEAST-LOJA DE RECURSOS DE CORREVEM ABERTO DE ENDAÇÃO A PARTIMANTE PARA ANESENHA DE MACHINE.
- FEATHR - Uma loja de recursos de alto desempenho e de alta qualidade.
- RecursoForm - Uma loja de recursos virtuais. Transforme sua infraestrutura de dados existente em uma loja de recursos.
- Tecton - Uma plataforma de recursos totalmente gerenciada criada para orquestrar o ciclo de vida completo dos recursos.
Ajuste hiperparâmetro
Ferramentas e bibliotecas para executar o ajuste do hiperparâmetro.
- Conselheiro - Implementação de código aberto do Google Vizier para o ajuste de hiper parâmetros.
- Hyperas - Um invólucro muito simples para a otimização conveniente de hiperparâmetro.
- Hiperopt - Otimização de hiperparâmetro assíncrono distribuído em Python.
- KATIB - Sistema baseado em Kubernetes para ajuste de hiperparâmetro e pesquisa de arquitetura neural.
- Kerastuner-Estrutura de otimização de hiperparâmetro fácil de usar e escalonável.
- Optuna - Estrutura de otimização de hiperparâmetro de código aberto para automatizar a pesquisa de hiperparâmetro.
- Scikit Optimize - biblioteca simples e eficiente para minimizar funções caras e barulhentas de caixa preta.
- Talos - Otimização de hiperparâmetro para Tensorflow, Keras e Pytorch.
- Tune - Biblioteca Python para execução do experimento e ajuste hiperparâmetro em qualquer escala.
Compartilhamento de conhecimento
Ferramentas para compartilhar conhecimento a toda a equipe/empresa.
- Knowledge Repo - Plataforma de compartilhamento de conhecimento para cientistas de dados e outras profissões técnicas.
- KYSO - Um local para insights de dados para que toda a sua equipe possa aprender com seus dados.
Plataforma de aprendizado de máquina
Soluções completas de plataforma de aprendizado de máquina.
- Aiware - Aiware ajuda as equipes do MLOPs a avaliar, implantar, integrar, escalar e monitorar modelos ML.
- Algoritmia - governe com segurança suas operações de aprendizado de máquina com um ciclo de vida saudável de ML.
- Allegro AI - Transforme a pesquisa ML/DL em produtos. Mais rápido.
- Bodywork - implanta projetos de aprendizado de máquina desenvolvidos em Python, para Kubernetes.
- CNVRG-Uma plataforma de aprendizado de máquina de ponta a ponta para criar e implantar modelos de IA em escala.
- DAGSHUB - Uma plataforma criada em ferramentas de código aberto para gerenciamento de dados, modelo e pipeline.
- Dataiku - Plataforma democratizando o acesso a dados e permitindo que as empresas construam seu próprio caminho para a IA.
- DataRobot-Plataforma AI que democratiza a ciência de dados e automatiza o ML de ponta a ponta em escala.
- Domino - Um lugar para suas ferramentas de ciência de dados, aplicativos, resultados, modelos e conhecimento.
- Plataforma de Impulse de Edge para criar, otimizar e implantar algoritmos AI/ML para dispositivos de borda.
- Envd - Ambiente de Desenvolvimento de Aprendizado de Máquinas para Ciência de Dados e equipes de engenharia de IA/ML.
- FedML - simplifica o fluxo de trabalho do aprendizado federado em qualquer lugar em qualquer escala.
- Gradiente - Plataforma Multicloud IC/CD e MLOPs para equipes de aprendizado de máquina.
- H2O - Líder de código aberto em IA com uma missão para democratizar a IA para todos.
- HopSworks - Plataforma de código aberto para desenvolver e operar modelos de aprendizado de máquina em escala.
- IGUAZIO-Plataforma de ciência de dados que automatiza MLOPs com pipelines de aprendizado de máquina de ponta a ponta.
- Katonic - automatize seu ciclo de inteligência com a plataforma Katonic Mlops.
- KNIME - Crie e produzindo ciência de dados usando um ambiente fácil e intuitivo.
- KUBEFLOW - Fazendo implantações de fluxos de trabalho ML em Kubernetes simples, portáteis e escaláveis.
- Lynxkite - Uma plataforma completa de ciência de dados de gráficos para gráficos muito grandes e outros conjuntos de dados.
- ML Workspace-IDE all-in-one baseado na Web especializado em aprendizado de máquina e ciência de dados.
- MLREEF - Plataforma Mlops de código aberto que ajuda a colaborar, reproduzir e compartilhar seu trabalho de ML.
- Modzy - Implante, conecte, execute e monitore os modelos de aprendizado de máquina (ML) na empresa e na borda.
- Plataforma Neu.ro-MLOPs que integra ferramentas de código aberto e proprietárias em sistemas orientados ao cliente.
- Omnimizador - simplifica e acelera os MLOPs, preenchendo a lacuna entre os modelos ML e o hardware de borda.
- Pachyderm-combina linhagem de dados com pipelines de ponta a ponta em Kubernetes, projetados para a empresa.
- Polyaxon - Uma plataforma para aprendizado de máquina reprodutível e escalável e aprendizado profundo em Kubernetes.
- Sagemaker - Serviço totalmente gerenciado que fornece a capacidade de construir, treinar e implantar modelos ML rapidamente.
- SAS VIYA - Cloud Native AI, plataforma analítica e de gerenciamento de dados que suporta o ciclo de vida do Analytics.
- Semática-Uma ferramenta de pipeline de ponta a ponta de código aberto para ir do protótipo do laptop para a nuvem em pouco tempo.
- SIGOPT - Uma plataforma que facilita o rastreamento de execuções, visualiza o treinamento e escala o ajuste hiperparâmetro.
- Truefoundry - Uma plataforma MLOPs nativa em nuvem sobre o Kubernetes para simplificar o treinamento e a porção de modelos de ML.
- Valohai - leva você do POC à produção, gerenciando todo o ciclo de vida do modelo.
Modelo de justiça e privacidade
Ferramentas para realizar a justiça e a privacidade do modelo na produção.
- AIF360 - Um conjunto abrangente de métricas de justiça para conjuntos de dados e modelos de aprendizado de máquina.
- Fairlearn - Um pacote Python para avaliar e melhorar a justiça dos modelos de aprendizado de máquina.
- Opacus - Uma biblioteca que permite o treinamento de modelos de Pytorch com privacidade diferencial.
- Privacidade do Tensorflow - Biblioteca para treinamento de modelos de aprendizado de máquina com privacidade para o treinamento de dados.
Interpretabilidade do modelo
Ferramentas para executar a interpretabilidade/explicação do modelo.
- Alibi - Biblioteca Python de código aberto, permitindo a inspeção e interpretação do modelo ML.
- Captum - Interpretabilidade do modelo e compreensão da Biblioteca para Pytorch.
- ELI5 - Pacote Python, que ajuda a depurar classificadores de aprendizado de máquina e explicar suas previsões.
- InterpretML - Um kit de ferramentas para ajudar a entender os modelos e ativar o aprendizado de máquina responsável.
- Lime - explicando as previsões de qualquer classificador de aprendizado de máquina.
- Lucid - Coleção de infraestrutura e ferramentas para pesquisa na interpretabilidade da rede neural.
- SAGE - Para calcular a importância do recurso global usando os valores do Shapley.
- Shap - Uma abordagem teórica do jogo para explicar a saída de qualquer modelo de aprendizado de máquina.
Ciclo de vida do modelo
Ferramentas para gerenciar o ciclo de vida do modelo (experimentos de rastreamento, parâmetros e métricas).
- Aeromancia - Uma estrutura para realizar IA e ML reprodutível para pesos e vieses.
- AIM - Uma maneira super fácil de gravar, pesquisar e comparar 1000s de treinamento em ML.
- Cascade - Biblioteca de ferramentas de engenharia ML para prototipagem rápida e gerenciamento de experimentos.
- Cometa - Rastreie seus conjuntos de dados, alterações de código, histórico de experimentação e modelos.
- Guild AI - rastreamento de experimentos de código aberto, automação de pipeline e ajuste hiperparâmetro.
- Controle de lembrança - versão para aprendizado de máquina com suporte ao Amazon S3 e Google Cloud Storage.
- Perda -time - facilita o rastreamento do progresso de um projeto de aprendizado de máquina.
- MLFlow - Plataforma de código aberto para o ciclo de vida do aprendizado de máquina.
- ModelDB - Versão do modelo ML de código aberto, metadados e gerenciamento de experimentos.
- Netuno AI - A ferramenta de gerenciamento de experimentos mais leve que se encaixa em qualquer fluxo de trabalho.
- Sagrado - uma ferramenta para ajudá -lo a configurar, organizar, registrar e reproduzir experimentos.
- Pesos e vieses - uma ferramenta para visualizar e rastrear seus experimentos de aprendizado de máquina.
Modelo Serviço
Ferramentas para servir modelos em produção.
- BANANA - Hospedar seu código de inferência ML em GPUs sem servidor e integrá -lo ao seu aplicativo com uma linha de código.
- Beam - Desenvolva -se em GPUs sem servidor, implante APIs altamente executivas e protótipos rapidamente modelos ML.
- Bentoml-Plataforma de código aberto para porção de modelo ML de alto desempenho.
- Orçamento - Implante um serviço de inferência de ML com orçamento em menos de 10 linhas de código.
- Cog-Ferramenta de código aberto que permite empacotar modelos ML em um contêiner padrão e pronto para produção.
- Cortex - Modelo de aprendizado de máquina Infraestrutura de servir.
- APIs de inferência do hospedeiro Geniusrise, inferência em massa e textos finos, visão, áudio e modelos multimodais.
- Gradio - Crie componentes de interface do usuário personalizáveis em torno de seus modelos.
- GraphPipe - Model Learning Model Implantment simplificou.
- Hydrofera - Plataforma para implantar seu aprendizado de máquina na produção.
- KfServing - Definição de recursos personalizados do Kubernetes para servir modelos ML em estruturas arbitrárias.
- Localai - API REST de substituição de drop -in que é compatível com as especificações da API OpenAI para inferir.
- Merlin - Uma plataforma para implantar e servir modelos de aprendizado de máquina.
- MLEM - Versão e implante seus modelos ML seguindo os princípios do Gitops.
- Opyrator - transforma seu código ML em microsserviços com API da Web, GUI interativa e muito mais.
- Previsão - coleta de eventos, implantação de algoritmos, avaliação, consulta a resultados preditivos via APIs.
- Quix - Plataforma sem servidor para processar fluxos de dados em tempo real com modelos de aprendizado de máquina.
- Rune - fornece contêineres para encapsular e implantar pipelines e aplicativos EDgeml.
- Seldon - Pegue seus projetos de ML do POC à produção com máxima eficiência e risco mínimo.
- Streamlit - permite criar aplicativos para seus projetos ML com scripts python enganosamente simples.
- Serviço Tensorflow - Sistema de servir de alto desempenho flexível para modelos de ML, projetados para produção.
- TorchServe - Uma ferramenta flexível e fácil de usar para servir modelos Pytorch.
- Triton Inference Server - fornece uma solução otimizada de infecção em nuvem e borda.
- Vespa - Armazene, pesquise, organize e faça inferências aprendidas pela máquina em relação ao big data no horário de servir.
- Wallaroo.ai - Uma plataforma para implantar, servir e otimizar modelos de ML em ambientes em nuvem e borda.
Teste de modelo e validação
Ferramentas para testar e validar modelos.
- Pacote DeepChecks - Pacote de código aberto para validar modelos e dados ML, com várias verificações e suítes.
- Starwhale - Uma plataforma MLOPS/LLMOPS para construção de modelos, avaliação e ajuste fino.
- Trubrics - Valide o aprendizado de máquina com ciência de dados e feedback de especialistas em domínio.
Ferramentas de otimização
Ferramentas de otimização relacionadas à escalabilidade do modelo na produção.
- Acelerar-Uma maneira simples de treinar e usar modelos Pytorch com precisão multi-GPU, TPU, mista.
- Dask - fornece paralelismo avançado para análise, permitindo o desempenho em escala para as ferramentas que você ama.
- Biblioteca de otimização de aprendizado profundo e profundo que torna o treinamento distribuído fácil, eficiente e eficaz.
- Biblioteca de computação distribuída de fibra - Python para clusters de computadores modernos.
- Horovod - Estrutura de treinamento de aprendizado profundo distribuído para Tensorflow, Keras, Pytorch e Apache MXNET.
- MAHOUT - estrutura de álgebra linear distribuída e Scala DSL matematicamente expressiva.
- MLLIB - Biblioteca de aprendizado de máquina escalável da Apache Spark.
- Modin - Acelere seus fluxos de trabalho de pandas alterando uma única linha de código.
- Nebullvm-biblioteca fácil de usar para aumentar a inferência da IA.
- NOS - Módulo de código aberto para executar cargas de trabalho de IA em Kubernetes de maneira otimizada.
- Petastorm - permite uma única máquina ou treinamento e avaliação distribuídos de modelos de aprendizado profundo.
- Rapids-dá a capacidade de executar pipelines de ponta a ponta de ciência e análise de dados inteiramente nas GPUs.
- Ray - estrutura rápida e simples para criar e executar aplicativos distribuídos.
- Singa - Projeto de nível superior do Apache, com foco no treinamento distribuído dos modelos DL e ML.
- TPOT - Ferramenta ML automatizada que otimiza os pipelines de aprendizado de máquina usando programação genética.
Ferramentas de simplificação
Ferramentas relacionadas à simplificação e padronização do aprendizado de máquina.
- Chassis - transforma modelos em recipientes amigáveis ao ML que correm em qualquer lugar.
- Hermione - Ajude os cientistas de dados a criar códigos mais organizados, de uma maneira mais rápida e simples.
- HYDRA - Uma estrutura para configurar elegantemente aplicativos complexos.
- KOALAS - API PANDAS no Apache Spark. Torna os cientistas de dados mais produtivos ao interagir com o Big Data.
- Ludwig - permite que os usuários treinem e testem modelos de aprendizado profundo sem a necessidade de escrever código.
- MLNotify - Não há necessidade de continuar verificando seu treinamento, apenas uma linha de importação e você saberá o segundo em que está pronto.
- PyCaret - Biblioteca de aprendizado de máquina de código aberto, de código baixo em Python.
- Sagify - Um utilitário da CLI para treinar e implantar modelos ML/DL no AWS Sagemaker.
- SOOPERVISOR - Exportar projetos ML para Kubernetes (Flows de Trabalho de Argo), Fluxo de Aéreo, Lotes da AWS e Slurm.
- SOORGEON - Converta notebooks monolíticos de Jupyter em oleodutos sustentáveis.
- TRAINGERATER - Um aplicativo da Web para gerar código de modelo para aprendizado de máquina.
- Turi Create - simplifica o desenvolvimento de modelos personalizados de aprendizado de máquina.
Análise visual e depuração
Ferramentas para realizar análises visuais e depuração de modelos ML/DL.
- APORIA - Observabilidade com monitoramento e explicação personalizados para modelos de ML.
- ARIZE-Uma plataforma de observabilidade e monitoramento de modelos de ponta a ponta gratuita e modelo.
- Evidentemente - Relatórios interativos para analisar modelos de ML durante a validação ou monitoramento da produção.
- Fiddler - Monitore, explique e analise sua IA em produção.
- Moletíssimo - Uma ferramenta de depuração visual agnóstica do modelo para aprendizado de máquina.
- Nannyml - Algoritmo capaz de capturar totalmente o impacto do desvio de dados no desempenho.
- Netron - Visualizador para Rede Neural, Aprendizado Deep e Modelos de Aprendizado de Máquinas.
- OPIK - Avalie, teste e ship LLM Aplicações com um conjunto de ferramentas de observabilidade.
- Phoenix - Mlops em um notebook para solução de problemas e modelos generativos de LLM, CV e tabulares de ajuste fino.
- RadicalBit - A solução de código aberto para monitorar seus modelos de IA em produção.
- Superwise-a observabilidade do modelo de nível corporativo totalmente automatizado em uma plataforma SaaS de autoatendimento.
- WhyLogs - O padrão de código aberto para registro de dados. Ativa o monitoramento e a observabilidade da ML.
- YellowBrick - Análise visual e ferramentas de diagnóstico para facilitar a seleção do modelo de aprendizado de máquina.
Ferramentas de fluxo de trabalho
Ferramentas e estruturas para criar fluxos de trabalho ou dutos no contexto de aprendizado de máquina.
- Argo - Motor de fluxo de trabalho nativo de contêiner de código aberto para orquestrar trabalhos paralelos em Kubernetes.
- Automatate Studio - Construa e implante rapidamente fluxos de trabalho movidos a IA.
- Couler - Interface unificada para construir e gerenciar fluxos de trabalho em diferentes mecanismos de fluxo de trabalho.
- DSTACK - Uma ferramenta de núcleo aberto para automatizar os fluxos de trabalho de dados e treinamento.
- Flyte - Fácil de criar fluxos de trabalho simultâneos, escaláveis e sustentáveis para o aprendizado de máquina.
- HAMILTON - Um micro -quadro de uso geral escalável para definir fluxos de dados.
- Kale - visa simplificar a experiência de ciência de dados de implantar os fluxos de trabalho da Kubeflow Pipelines.
- Kedro - Biblioteca que implementa a melhor prática de engenharia de software para dados e pipelines de ML.
- Módulo Luigi - Python que ajuda a criar pipelines complexos de trabalhos em lote.
- Metaflow - LIB favorável ao ser humano que ajuda cientistas e engenheiros a construir e gerenciar projetos de ciência de dados.
- MLRUN - Mecanismo genérico para os cientistas de dados construirem, executarem e monitorarem tarefas e pipelines de ML.
- Orchest - Visual Pipeline Editor e Orchestrator de fluxo de trabalho com uma interface do usuário fácil de usar e com base em Kubernetes.
- PLOOMBER - Escreva pipelines sustentáveis e prontos para a produção. Desenvolva localmente, implante para a nuvem.
- Prefeito - Um sistema de gerenciamento de fluxo de trabalho, projetado para infraestrutura moderna.
- VDP - Uma ferramenta de código aberto para integrar perfeitamente a IA para dados não estruturados na pilha de dados moderna.
- Wordware-Um IDE de IDE hospedado na Web, onde especialistas em domínio não técnico podem criar agentes de IA específicos para tarefas.
- ZenML - Uma estrutura MLOPS de código aberto extensível para criar pipelines reproduzíveis.
Recursos
Onde descobrir novas ferramentas e discutir sobre as existentes.
Artigos
- Um passeio de plataformas de aprendizado de máquina de ponta a ponta (linha de dados)
- Entrega contínua para aprendizado de máquina (Martin Fowler)
- Entregar a visão dos MLOPs: uma abordagem baseada em maturidade (Gigaom)
- Operações de aprendizado de máquina (MLOPS): Visão geral, definição e arquitetura (ARXIV)
- Roteiro MLOPS: Um Guia de Carreira Completo do MLOPS (Blogs Scaler)
- MLOPS: PIPELOS CONTRINADOS DE ENTREGA E AUTOMATION no aprendizado de máquina (Google)
- Mlops: aprendizado de máquina como disciplina de engenharia (médio)
- Regras de aprendizado de máquina: práticas recomendadas para a ML Engineering (Google)
- A pontuação do teste de ML: uma rubrica para a prontidão de produção de ML e a redução de dívida técnica (Google)
- O que é Mlops? (Nvidia)
Livros
- Mlops iniciantes com mlflow (Apress)
- Building Machine Learning Pipelines (O'Reilly)
- Construção de aplicativos alimentados com aprendizado de máquina (O'Reilly)
- Aprendizagem profunda na produção (AI Summer)
- Projetando sistemas de aprendizado de máquina (O'Reilly)
- Mlops de engenharia (Packt)
- Implementando Mlops na empresa (O'Reilly)
- Apresentando Mlops (O'Reilly)
- Kubeflow for Machine Learning (O'Reilly)
- Guia de operações Kubeflow (O'Reilly)
- Machine Learning Design Patterns (O'Reilly)
- Engenharia de Aprendizado de Máquinas em Ação (Manning)
- ML OPS: Operacionalizando a Ciência dos Dados (O'Reilly)
- Mlops Engineering em escala (Manning)
- Mlops Lifecycle Toolkit (Apress)
- Aprendizagem profunda prática em escala com mlflow (packt)
- Mlops práticos (O'Reilly)
- Aprendizado profundo aplicado para produção (Packt)
- Aprendizado de máquina confiável (O'Reilly)
- O Machine Learning Solutions Architect Handbook (Packt)
Eventos
- Aplicar () - A Conferência de Engenharia de Dados ML
- Conferência MLOPS - Chaves e painéis
- Mlops World: Machine Learning in Production Conference
- NormConf - A Conferência de Tecnologia Normcore
- Stanford MLSYS Seminar Series
Outras listas
- Ml aplicado
- Artigos de automóveis impressionantes
- Automl incrível
- Ciência de dados impressionante
- DataOps incríveis
- Aprendizagem profunda incrível
- Conjuntos de dados de jogos impressionantes (inclui conteúdo de IA)
- Aprendizado de máquina incrível
- Mlops incríveis
- Aprendizado de máquina de produção incrível
- Python incrível
- Aprendizado profundo em produção
Podcasts
- Como a IA construiu isso
- Podcast Kubernetes do Google
- Aprendizado de máquina - Engenharia de software diariamente
- Mlops.Community
- Conversa de pipeline
- AI prática: aprendizado de máquina, ciência de dados
- Esta semana em aprendizado de máquina e ai
- True ML fala
Folga
- Kubeflow Workspace
- Mlops Community Wokspace
Sites
- Lojas de recursos para ML
- Feito com ml
- ML-OPS
- Comunidade Mlops
- Guia Mlops
- Mlops agora
Contribuindo
Todas as contribuições são bem -vindas! Por favor, dê uma olhada nas diretrizes de contribuição primeiro.