ELI5
ELI5は、機械学習分類器をデバッグし、予測を説明するのに役立つPythonパッケージです。
次の機械学習フレームワークとパッケージをサポートします。
- Scikit-Learn。現在、ELI5では、SCIKIT-LEARNの線形分類器と退行因子の重みと予測、テキストまたはSVGとしての決定ツリーを印刷することを可能にし、機能の重要性を示し、決定ツリーとツリーベースのアンサンブルの予測を説明します。 ELI5は、Scikit-Learnのテキスト処理ユーティリティを理解しており、それに応じてテキストデータを強調できます。パイプラインとfeatureUnionがサポートされています。また、ハッシュハッシュを元に戻すことにより、ハッシュベクトル化器を含むScikit-Learnパイプラインをデバッグすることもできます。
- Keras -Grad -CAMの視覚化を介して画像分類子の予測を説明します。
- XGBOOST-機能の重要性を示し、XGBClassifier、XgbRegressor、Xgboost.Boosterの予測を説明します。
- LightGBM-機能の重要性を示し、LGBMClassifierとLGBMRERSERSORの予測を説明します。
- catboost- catboostclassifier、catboostregressor、catboost.catboostの機能の重要性を示します。
- 稲妻 - 雷分類器と退行因子の重みと予測を説明します。
- sklearn-crfsuite。 ELI5では、sklearn_crfsuite.crfモデルの重みを確認できます。
ELI5は、ブラックボックスモデルを検査するためのいくつかのアルゴリズムも実装しています(ブラックボックス推定器の検査を参照)。
- TextExplainerでは、石灰アルゴリズムを使用してテキスト分類器の予測を説明できます(Ribeiro et al。、2016)。非テキストデータと任意のブラックボックス分類器を使用して石灰を使用するためのユーティリティもありますが、この機能は現在実験的です。
- 順列の重要性方法を使用して、ブラックボックス推定器の機能の重要性を計算できます。
説明とフォーマットは分離されています。コンソールに表示するテキストベースの説明、IPythonノートブックまたはWebダッシュボードに埋め込まれたHTMLバージョン、結果をさらに処理する場合はpandas.DataFrameオブジェクト、またはクライアントにカスタムレンダリングとフォーマットを実装できるJSONバージョンを取得できます。
ライセンスはMITです。
詳細については、ドキュメントを確認してください。