Eli5
O ELI5 é um pacote Python que ajuda a depurar classificadores de aprendizado de máquina e explicar suas previsões.
Ele fornece suporte para as seguintes estruturas e pacotes de aprendizado de máquina:
- Scikit-Learn. Atualmente, o ELI5 permite explicar pesos e previsões de classificadores e regressores lineares do Scikit-Learn, imprimir árvores de decisão como texto ou como SVG, mostrar importações de recursos e explicar previsões de árvores de decisão e conjuntos baseados em árvores. O ELI5 entende os utilitários de processamento de texto da Scikit-Learn e pode destacar os dados de texto de acordo. O oleoduto e a administração são suportados. Ele também permite depurar pipelines Scikit-Learn que contêm hashvectorizer, desfazendo o hash.
- Keras - Explique previsões de classificadores de imagem por meio de visualizações de pós -câmeras.
- XGBOOST - Mostrar importações de recursos e explicar previsões de xgbclassifier, xgbregressor e xgboost.booster.
- LightGBM - Mostrar importações de recursos e explicar previsões de LGBMClassifier e LGBMregressor.
- Catboost - Mostrar Importâncias de Catboostclassifier, CatboosTregressor e Catboost.catboost.
- Lightning - Explique pesos e previsões de classificadores de raios e regressores.
- Sklearn-Crfsuite. O ELI5 permite verificar os pesos dos modelos sklearn_crfsuite.crf.
O ELI5 também implementa vários algoritmos para inspecionar modelos de caixa preta (consulte Inspecionando estimadores de caixa preta):
- A TextexPlainer permite explicar previsões de qualquer classificador de texto usando o algoritmo de cal (Ribeiro et al., 2016). Existem utilidades para usar limão com dados não textos e classificadores de caixa preta arbitrária, mas esse recurso é atualmente experimental.
- O método de importância da permutação pode ser usado para calcular as importações de recursos para estimadores de caixas pretas.
Explicação e formatação são separadas; Você pode obter explicações baseadas em texto para exibir no console, versão html incorporável em um notebook ipython ou painéis da web, um objeto pandas.DataFrame se desejar processar resultados mais adiante ou versão JSON que permite implementar renderização e formatação personalizadas em um cliente.
A licença é MIT.
Verifique os documentos para mais.