ELI5
ELI5 es un paquete de Python que ayuda a depurar clasificadores de aprendizaje automático y explicar sus predicciones.
Proporciona soporte para los siguientes marcos y paquetes de aprendizaje automático:
- Scikit-learn. Actualmente, ELI5 permite explicar pesos y predicciones de clasificadores lineales y regresores lineales de Scikit-Learn, imprimir árboles de decisión como texto o como SVG, mostrar importantes de características y explicar las predicciones de los árboles de decisión y los conjuntos de árboles. Eli5 comprende las utilidades de procesamiento de texto de Scikit-Learn y puede resaltar los datos de texto en consecuencia. Se admiten tuberías y largometrajes. También permite depurar las tuberías de Scikit-Learn que contienen HashingVectorizer, deshaciendo el hashing.
- Keras: explique las predicciones de los clasificadores de imágenes a través de visualizaciones de cámaras graduadas.
- XGBOOST - Mostrar importantes de características y explicar las predicciones de XGBClassifier, XGBRegressor y XGBOost.Booster.
- LightGBM: muestre importantes características y explique las predicciones de LGBMClassifier y LGBMRegor.
- Catboost - Mostrar características importantes de CatboostClassifier, CatbooStressor y Catboost.catboost.
- Lightning: explique pesos y predicciones de los clasificadores y regresores de rayos.
- Sklearn-Crfsuite. Eli5 permite verificar pesas de los modelos sklearn_crfsuite.crf.
ELI5 también implementa varios algoritmos para inspeccionar modelos de caja negra (ver estimadores de caja negra):
- TextExPlainer permite explicar las predicciones de cualquier clasificador de texto utilizando el algoritmo de cal (Ribeiro et al., 2016). Hay utilidades para usar cal con datos de no texto y clasificadores arbitrarios de caja negra también, pero esta característica es actualmente experimental.
- El método de importancia de la permutación se puede utilizar para calcular las importantes de características para los estimadores de caja negra.
La explicación y el formato están separados; Puede obtener una explicación basada en texto para mostrar en consola, versión HTML integrable en un cuaderno de iPython o paneles web, un objeto pandas.DataFrame si desea procesar más resultados, o la versión JSON que permite implementar la representación y formateo personalizado en un cliente.
La licencia es MIT.
Consulte los documentos para obtener más información.