distillerダウンロードdistillerソースコードのダウンロード

distiller

パイソン

1.0.0

ダウンロード

ショ和プロジェクトの中止-このプロジェクトは、Intelによって維持されなくなります。このプロジェクトは、既知のセキュリティエスケープを持っていると特定されています。 Intelは、メンテナンス、バグ修正、新しいリリース、または更新など、このプロジェクトの開発と貢献を停止しましたが、これに限定されません。 Intelは、このプロジェクトのパッチを受け入れなくなりました。

wikiとチュートリアル|ドキュメント|開始|アルゴリズム|デザイン|よくある質問

Distillerは、ニューラルネットワーク圧縮研究のためのオープンソースPythonパッケージです。

ネットワーク圧縮は、ニューラルネットワークのメモリフットプリントを削減し、推論速度を上げ、エネルギーを節約できます。 Distillerは、スパース誘発方法や低精度の算術などの圧縮アルゴリズムをプロトタイピングおよび分析するためのPytorch環境を提供します。

強調表示された機能

自動圧縮
- 自動モデル圧縮（AMC）
ウェイトプルーニング
- マグニチュードのしきい値、感度のしきい値、ターゲットスパースレベル、および活性化統計を使用した要素ごとの剪定
構造化された剪定
- 畳み込み：2D（カーネルのように）、3D（フィルターで）、4D（レイヤーワイズ）、およびチャネルごとの構造化された剪定。
- 完全に接続されています：列ごとの構造化された剪定。
- 構造グループ（4つのフィルターの構造など）。
- 重みまたは活性化基準（LP-Norm、Apoz、勾配、ランダムなど）を使用した構造ランク。
- 新しい構造のサポート（たとえばブロックプルーニング）
コントロール
- ソフト（フォワードパスのみのマスクのみ）とハードプルーニング（永久にニューロンを切断する）
- デュアルウェイトコピー（マスクされた重量での計算損失ですが、マスクされていない重量を更新）
- 剪定されたニューロンと接続を永久に除去するために、モデルの薄化（別名「ネットワークガベージ除去」）。
スケジュール
- 剪定、正則化、学習率の減衰の柔軟なスケジューリング（圧縮スケジューリング）
- ワンショットおよび反復的な剪定（および微調整）がサポートされています。
- 各トレーニングステップを簡単に制御します（例：レイヤーによる貪欲なレイヤーから完全なモデル剪定まで）。
- 個々の接続と完全な構造を剪定するための自動段階的スケジュール（AGP）。
- 圧縮スケジュールはYAMLファイルで表されるため、単一のファイルが実験の詳細をキャプチャします。この依存関係噴射設計では、蒸留器スケジューラとライブラリがアルゴリズムの将来の拡張から切り離されています。
要素ごとのおよびフィルターごとの剪定感度分析（L1-ノームのしきい値を使用）。このノートブックを使用して、分析したいくつかのネットワークのデータを調べます。
正則化
- L1-NORM要素ごとの正規化
- グループLassoグループ分散正規化
量子化
- 異なるレイヤーのカスタマイズ可能なビット幅構成により、既存のモデルを量子化されたバージョンに変換する自動メカニズム。異なる量子化方法のためにモデルを書き直す必要はありません。
- トレーニングされた全精度モデルのトレーニング後の量子化、動的および静的（統計ベース）
- ループでの量子化認識トレーニングのサポート
知識の蒸留
- 他の利用可能な剪定 /正則化 /量子化方法と組み合わせて、知識の蒸留によるトレーニング。
条件付き計算
- 早期出口のサンプル実装
低ランク分解
- 切り捨てられたSVDのサンプル実装
宝くじチケット仮説トレーニング
Pandas DataFramesを使用した統計の要約をエクスポートするため、データを簡単にスライス、クエリ、表示、グラフ化できます。
実験を計画し、圧縮結果を分析するための一連のJupyterノートブック。このページに表示されるグラフと視覚化は、付属のJupyterノートブックに由来します。
- このノートブックをご覧ください。このノートは、密度の高いアレックスネットモデルの視覚的な側面を比較しています。
- このノートブックは、モデルデータからパフォーマンスインジケーターグラフを作成します。
ライブラリが提供するビルディングブロックを使用して、公開された研究論文の実装をサンプルします。私たちのモデルZooでの研究論文の議論を参照してください。
コンソール、テキストファイル、テンソルボード形式のファイルへのログ。
ONNXへのエクスポート（ONNX標準化を保留する量子化モデルのエクスポート）

インストール

これらの指示は、地元のマシンで蒸留器を稼働させるのに役立ちます。

1。クローン蒸留器

githubから蒸留所コードリポジトリをクローンします。

 $ git clone https://github.com/IntelLabs/distiller.git

次のドキュメントの残りの部分は、リポジトリをdistillerと呼ばれるディレクトリにクローン化したことを前提としています。

2。Python仮想環境を作成します

Python仮想環境を使用することをお勧めしますが、もちろんそれはあなた次第です。仮想環境で蒸留器を使用することに特別なことは何もありませんが、完全性については、いくつかの指示を提供します。
仮想環境を作成する前に、ディレクトリdistillerにあることを確認してください。環境を作成した後、 distiller/envと呼ばれるディレクトリが表示されます。

Virtualenvを使用します

virtualenvがインストールされていない場合は、ここでインストール手順を見つけることができます。

環境を作成するには、実行してください。

 $ python3 -m virtualenv env

これにより、Python仮想環境が保存されているenvという名前のサブディレクトリが作成され、現在のシェルをデフォルトのPython環境として使用するように構成します。

venvを使用します

venvを使用する場合は、インストールから始めます。

 $ sudo apt-get install python3-venv

次に、環境を作成します。

 $ python3 -m venv env

virtualenvと同様に、これはdistiller/envと呼ばれるディレクトリを作成します。

環境をアクティブにします

venvおよびvirtualenvの環境アクティベーションと非アクティブ化コマンドは同じです。
！注：依存関係パッケージのインストールを進める前に、必ず環境をアクティブにしてください。

 $ source env/bin/activate

3.蒸留酒パッケージをインストールします

最後に、 pip3を使用して、蒸留器パッケージとその依存関係をインストールします。

 $ cd distiller
$ pip3 install -e .

これにより、「開発モード」に蒸留器がインストールされます。つまり、コードで行われた変更は、インストールコマンドを再実行せずに環境に反映されます（したがって、GITリポジトリからの変更をプルしてから再インストールする必要はありません）。

注：

蒸留器は、Ubuntu 16.04 LTSおよびPython 3.5でのみテストされています。
GPUを使用していない場合は、コードを少し調整する必要がある場合があります。

必要なPytorchバージョン

蒸留器は、Cuda 10.1を使用するPytorch 1.3.1のデフォルトインストールを使用してテストされます。 TorchVisionバージョン0.4.2を使用しています。これらはDistillerのrequirements.txtに含まれており、上記のDistillerパッケージをインストールするときに自動的にインストールされます。

環境でCUDA 10.1を使用しない場合は、Pytorch Webサイトを参照して、Pytorch 1.3.1とTorchvision 0.4.2の互換性のあるビルドをインストールしてください。

はじめる

Distillerには、さまざまなモデルタイプをカバーするサンプルアプリケーションとチュートリアルが付属しています。

モデルタイプ	スパース	トレーニング後の量子化	量子化対象トレーニング	自動圧縮（AMC）	知識の蒸留
画像分類	✅	✅	✅	✅	✅
単語レベルの言語モデル	✅	✅
翻訳（gnmt）		✅
推奨システム（NCF）		✅
オブジェクトの検出	✅

詳細については、Examples Directoryにアクセスしてください。

例を超えて、参照する他のリソース：

頻繁に露出した質問（FAQ）
モデル動物園
圧縮スケジューリング
使用法
量子化のためのモデルの準備
チュートリアル：剪定フィルターとチャネル

基本的な使用例

以下は、蒸留器の画像分類サンプルを使用した簡単な例であり、蒸留器の機能の一部を示しています。

トレーニングのみ
スパースされたモデルのパラメーター統計を取得します
トレーニング後の量子化

例：シンプルなトレーニングのみのセッション（圧縮なし）

以下は、CIFAR10データセットの「Simplenet」という名前のネットワークのトレーニングのみ（圧縮なし）を呼び出します。これは、Torchvisionのサンプルイメージネットトレーニングアプリケーションに大まかに基づいているため、そのアプリケーションを使用している場合は馴染みがあります。この例では、圧縮メカニズムを呼び起こすことはありません。剪定後に微調整するためにトレーニングが不可欠な部分であるため、トレーニングするだけです。

このコマンドを初めて実行すると、CIFAR10コードがマシンにダウンロードされることに注意してください。これには少し時間がかかる場合があります。ダウンロードプロセスを完了してください。

CIFAR10データセットへのパスは任意ですが、例では、データセットを蒸留器と同じディレクトリレベルに配置します（つまり../../../data.cifar10 ）。

まず、サンプルディレクトリに変更してから、アプリケーションを呼び出します。

 $ cd distiller/examples/classifier_compression
$ python3 compress_classifier.py --arch simplenet_cifar ../../../data.cifar10 -p 30 -j=1 --lr=0.01

テンソルボードバックエンドを使用してトレーニングの進行状況を表示できます（以下の図では、LR値が異なるいくつかのトレーニングセッションを示します）。圧縮セッションの場合、アクティベーションとパラメーターのスパースレベルのトレース、および正則化の損失を追加しました。

例：Sparsified Modelのパラメーター統計を取得します

GITリポジトリに、32ビットフロートでトレーニングしたResNet20モデルのいくつかのチェックポイントを含めました。チャネルごとのグループラッソの正規化でトレーニングしたモデルのチェックポイントをロードしましょう。
次のコマンドライン引数を使用すると、サンプルアプリケーションはモデル（ --resume ）をロードし、モデルの重み（ --summary=sparsity ）に関する統計を印刷します。これは、以前に剪定されたモデルをロードして、たとえば重みのスパース統計を調べる場合に役立ちます。保存されたチェックポイントを再開する場合、チェックポイントが使用するネットワークアーキテクチャ（ -a=resnet20_cifar ）をアプリケーションに伝える必要があることに注意してください。

 $ python3 compress_classifier.py --resume=../ssl/checkpoints/checkpoint_trained_ch_regularized_dense.pth.tar -a=resnet20_cifar ../../../data.cifar10 --summary=sparsity

パラメーターテンソルのさまざまなスパースを詳述するテキストテーブルが表示されます。最初の列はパラメーター名で、その後、その形状、密なモデルの非ゼロ要素（NNZ）の数、およびスパースモデルが続きます。次の列のセットは、列ごとの、列ごとの、チャネルごと、核面、フィルターごとのスパース、および要素ごとのスパースを示しています。
それをまとめることは、要素の絶対値の標準控除、平均、および平均です。

Compression Insights Notebookでは、Matplotlibを使用して、この要約のバーチャートをプロットします。

メモリフットプリント圧縮は非常に低いですが、このモデルは実際にMacの計算の26.6％を節約します。

 $ python3 compress_classifier.py --resume=../ssl/checkpoints/checkpoint_trained_channel_regularized_resnet20_finetuned.pth.tar -a=resnet20_cifar ../../../data.cifar10 --summary=compute

例：トレーニング後の量子化

この例では、CIFAR10に対してRESNET20の8ビット量子化を実行します。 32ビットフロートでトレーニングしたRESNET20モデルのチェックポイントをGITリポジトリに含めました。このモデルを採用して量子化します。

 $ python3 compress_classifier.py -a resnet20_cifar ../../../data.cifar10 --resume ../ssl/checkpoints/checkpoint_trained_dense.pth.tar --quantize-eval --evaluate

上記のコマンドラインは、量子化されたモデルパラメーターを含むquantized_checkpoint.pth.tarという名前のチェックポイントを保存します。こちらの例を参照してください。

サンプルJupyterノートブックを探索してください

蒸留器が付属しているノートブックのセットについては、ここで説明します。これについては、Jupyterノートブックサーバーをインストールする手順も説明しています。
サーバーをインストールして実行した後、剪定感度分析をカバーするノートブックをご覧ください。

感度分析は長いプロセスであり、このノートブックは、感度分析のいくつかのセッションの出力であるCSVファイルをロードします。

テストの実行

私たちは現在、テストで軽量であり、これは貢献が大いに高く評価される分野です。
テストには、システムテストとユニットテストの2つのタイプがあります。ユニットテストを呼び出すには：

 $ cd distiller/tests
$ pytest

システムテストにはCIFAR10を使用します。そのサイズがより迅速なテストになるためです。システムテストを呼び出すには、すでにダウンロードしたCIFAR10データセットへのパスを提供する必要があります。または、CIFAR10データセットの場所を指定せずにfull_flow_tests.pyを呼び出して、テストでデータセットをダウンロードさせます（最初の呼び出しのみ）。 --cifar1o-path現在のディレクトリにデフォルトであることに注意してください。
システムテストは短くなく、テストでデータセットをダウンロードする必要がある場合はさらに長くなります。

 $ cd distiller/tests
$ python full_flow_tests.py --cifar10-path=<some_path>

すべてのテストが成功した場合、スクリプトはステータス0で終了します。

HTMLドキュメントサイトの生成

実行して、MKDOCと必要なパッケージをインストールします。

 $ pip3 install -r doc-requirements.txt

プロジェクトドキュメントを作成するには、実行されます。

 $ cd distiller/docs-src
$ mkdocs build --clean

これにより、ドキュメントWebサイトを含む「サイト」という名前のフォルダーが作成されます。ドキュメントのホームページを表示するには、蒸留器/docs/site/index.htmlを開きます。

バージョン化

バージョン化にはSemverを使用しています。利用可能なバージョンについては、このリポジトリのタグを参照してください。

ライセンス

このプロジェクトは、Apacheライセンス2.0に基づいてライセンスされています - 詳細については、ライセンス.mdファイルを参照してください

コミュニティ

蒸留器を使用したGitHubプロジェクト

Degirum Prunedモデル - 剪定されたモデルと関連情報を含むリポジトリ。
TORCHFI -TORCHFIは、研究目的でPytorchの上に構築された断層注入フレームワークです。
HSI -Toolbox-ハイパースペクトルCNN圧縮とバンド選択

蒸留器を引用する研究論文

Brunno F. Goldstein、Sudarshan Srinivasan、Dipankar Das、Kunal Banerjee、Leandro Santiago、Victor C. Ferreira、Alexandre S. Nery、Sandip Kundu、Felipe MG Franca。
圧縮された深い学習モデルの信頼性評価、
IEEE 11th Latin American Symposium on Circuits＆Systems（LASCAS）、サンノゼ、コスタリカ、2020年、1-5ページ。
Pascal Bacchus、Robert Stewart、Ekaterina Komendantskaya。
FPGAの量子化されたニューラルネットワークのための精度、トレーニング時間、およびハードウェア効率のトレードオフ、
適用された再構成可能なコンピューティングで。アーキテクチャ、ツール、およびアプリケーション。 ARC 2020。コンピューターサイエンスの講義ノート、Vol12083。Springer、Cham
インドラニル・チャクラボルティ、ムスタファ・フェイエス・アリ、ドン・ウン・キム、エイシュ・アンキット、カウシク・ロイ。
Geniex：ニューラルネットワークを使用して、メモリティブXBARSの非理想性をエミュレートするための一般化されたアプローチ、
Arxiv：2003.06902、2020。
アーメド・T・エルサケブ、プラノイ・ピルグンドラ、fatemehsadat mireshghallah、タレク・エルギンディ、チャールズ・アルバン・デレダル、ハディ・エスマエルザデ。
正弦波適応正則化を介したニューラルネットワークの勾配ベースの深い量子化、
Arxiv：2003.00146、2020。
Ziqing Yang、Yiming Cui、Zhipeng Chen、Wanxiang Che、Ting Liu、Shijin Wang、Guoping Hu。
TextBrewer：自然言語処理のためのオープンソースの知識蒸留ツールキット、
Arxiv：2002.12620、2020。
アレクサンダー・コズロフ、イヴァン・ラザレヴィッチ、ヴァシリー・シャンポロフ、ニコレイ・リアリシュキン、Yury Gorbachev。
高速モデル推論のためのニューラルネットワーク圧縮フレームワーク、
Arxiv：2002.08679、2020。
Moran Shkolnik、Brian Chmiel、Ron Banner、Gil Shomron、Yuri Nahshan、Alex Bronstein、Uri Weiser。
堅牢な量子化：それらをすべて支配する1つのモデル、
Arxiv：2002.07686、2020。
ムハンマド・アブドラ・ハニフ、ムハンマド・シャフィク。
salvagednn：顕著性駆動型の断層マッピングを通じて永続的な断層を持つ深いニューラルネットワークアクセラレータを救う、
王立協会の哲学的取引a：数学、物理的、工学科学科学volume 378、Issue 2164、2019。
https://doi.org/10.1098/rsta.2019.0164
Meiqi Wang、Jianqiao Mo、Jun Lin、Zhongfeng Wang、Li Du。
Dynexit：深い残留ネットワークの動的な早期排除戦略、
IEEE International Workshop on Signal Processing Systems（SIPS）、2019年。
Vinu Joseph、Saurav Muralidharan、Animesh Garg、Michael Garland、Ganesh Gopalakrishnan。
モデル圧縮へのプログラム可能なアプローチ、
Arxiv：1911.02497、2019
コード
Hui Guan、Lin Ning、Zhen Lin、Xipeng Shen、Huiyang Zhou、Seung-Hwan Lim。
CNNのインプレースゼロスペースメモリ保護、
2019年、神経情報処理システム（ニューリップ）に関する会議で。
Arxiv：1910.14479、2019
コード
Hossein Baktash、Emanuele Natale、Laurent Viennot。
ニューラルネットワーク圧縮の比較研究、
Arxiv：1910.11144、2019。
マキシム・ゼムリアニキン、アレクサンダー・スモルカロフ、タチアナ・カノバ、アンナ・ペトロヴィチェヴァ、グリゴリー・セレブリコフ。
512KIB RAMで十分です！ MCUのライブカメラフェイス認識DNN 、
IEEE International Conference on Computer Vision（ICCV）、2019年。
Ziheng Wang、Jeremy Wohlwend、Tao Lei。
大きな言語モデルの構造化された剪定、
Arxiv：1910.04732、2019。
Soroush Ghodrati、Hardik Sharma、Sean Kinzer、Amir Yazdanbakhsh、Kambiz Samadi、Nam Sung Kim、Doug Burger、Hadi Esmaeilzadeh。
インターリーブされたビットパーティション算術を介した深いニューラルネットワークの混合シグナル電荷ドメイン加速、
Arxiv：1906.11915、2019。
ギル・ショムロン、タル・ホロウィッツ、ウリ・ワイザー。
SMT-SA：収縮期アレイでの同時マルチスレッド、
IEEEコンピューターアーキテクチャレター（CAL）、2019年。
Shangqian Gao、Cheng Deng、およびHeng Huang。
構造的に重量共有によるクロスドメインモデル圧縮、
コンピュータービジョンとパターン認識に関するIEEE会議（CVPR）、2019、pp。8973-8982。
Moin Nadeem、Wei Fang、Brian Xu、Mitra Mohtarami、James Glass。
Fakta：自動エンドツーエンドのファクトチェックシステム、
2019年、計算言語学会協会（NAACL）の北米支部。
アーメドT.エルサケブ、プラノイピルグンドラ、ハディエスマエリザデ。
SINREQ：低ビット幅の深い量子化されたトレーニングのための一般化正弦波正規化、
Arxiv：1905.01416、2019。Code
Goncharenko A.、Denisov A.、Alyamkin S.、Terentev E.
ニューラルネットワークの量子化のための訓練可能なしきい値、
In：Rojas I.、Joya G.、Catala A.（Eds）Computational Intelligence Lecture Note in Computer Science、Vol11507。Springer、Cham。人工ニューラルネットワークに関する国際的なワークカンファレンス（IWANN 2019）。
アーメドT.エルサケブ、プラノイピルグンドラ、ハディエスマエリザデ。
分裂と征服：ニューラルネットワークの量子化されたトレーニングのための中間特徴表現を活用する、
Arxiv：1906.06033、2019
リッチー・チャオ、ユウェイ・フー、ジョーダン・ドッツェル、クリストファー・デ・サ、Zhiru Zhang。
外れ値チャネル分割を使用して再訓練せずにニューラルネットワークの量子化を改善する、
Arxiv：1901.09504、2019
コード
アンガド・S・レキ、ブライアン・ジマー、ニコラ・ネドヴィッチ、ニンシク・リュー、ランガラジャン・ベンカテサン、ミアオロン・ワン、ブルース・カイラニー、ウィリアム・J・ダリー、C・トーマス・グレイ。
深い学習推論のためのアナログ/混合シグナルハードウェアエラーモデリング、
Nvidia Research、2019年。
ノリオ・ナカタ。
診断医療イメージングのための人工知能の最近の技術開発、
日本のJournal of Radiology、2019年2月、第37巻、第2巻、pp 103–108。
アレクサンダー・ゴンチャレンコ、アンドレイ・デニソフ、セルゲイ・アリアムキン、エヴゲニー・テレンテフ。
均一なニューラルネットワーク量子化の高速調整可能なしきい値、
Arxiv：1812.07872、2018

作業に蒸留器を使用した場合は、次の引用を使用してください。

 @article{nzmora2019distiller,
  author       = {Neta Zmora and
                  Guy Jacob and
                  Lev Zlotnik and
                  Bar Elharar and
                  Gal Novik},
  title        = {Neural Network Distiller: A Python Package For DNN Compression Research},
  month        = {October},
  year         = {2019},
  url          = {https://arxiv.org/abs/1910.12232}
}

謝辞

公開されている作品は、他の多くの人々の仕事の上に構築されており、このクレジットはここにリストするには多すぎる人々に属します。

PythonとPytorchの開発者コミュニティは、Web上の多くの非常に貴重な洞察、例、アイデアを共有しています。
Distiller Model-Zooに実装された研究論文の著者は、研究のアイデア、理論的背景、結果を共有しています。

で構築されています

Pytorch-蒸留器が使用するテンソルおよびニューラルネットワークフレームワーク。
Jupyter-ノートブックサービング。
テンソルボード - トレーニンググラフを表示するために使用されます。
カデン - 前処理されたPytorchモデル。

免責事項

Distillerは、研究目的のための参照コードとしてリリースされます。それは公式のIntel製品ではなく、品質とサポートのレベルは公式製品から期待されていないかもしれません。追加のアルゴリズムと機能がライブラリに追加される予定です。オープンソースと研究コミュニティからのフィードバックと貢献は大歓迎です。

拡大する

追加情報