マキシム・バーマン、アマル・ランネン・トリキ、マシュー・B・ブラシコ
ESAT-PSI、ベルギー、Kuルーベン。
CVPR 2018で公開されています。プロジェクトページ、ARXIVペーパー、CVFオープンアクセスに関する論文を参照してください。
含まれるファイル:
バイナリlovasz_hinge 、実際の値のスコアを期待しています(正のスコアは前景ピクセルに対応します)。
Multiclass lovasz_softmax 、クラスの確率を期待しています(最大スコアリングカテゴリが予測されます)。まず、非正規化されたスコアにSoftmax層を使用します。
含まれるファイル:
警告:損失値と勾配は、Pytorchと同じであるとテストされています(ノートを参照)が、トレーニング設定でTF実装を使用していません。
原則の単純な証明については、デモを参照してください。
損失は単独で最適化できますが、最適な最適化ハイパーパラメーター(学習率、勢い)は、エントロピーに最適なものとは異なる場合があります。論文で説明したように、データセット-MIOU(Pascal VOCメジャー)の最適化は、クラスのバッチサイズと数に依存します。したがって、最初にクロスエントロピーで最適化し、損失との微調整、または2つの損失を組み合わせることにより、最良の結果が得られる可能性があります。
たとえば、Alexander Rakhlin et al。によるu-netおよびlovasz-softmaxの損失を伴う衛星画像からの作業土地被覆分類がどのように分類されているかを参照してください。 CVPR 18 Deepglobe Challengeで損失を使用しました。
Tensorflow Masterからのコンパイル(または、Tensorflow/Tensorflow@73e3215を含む将来の分布を使用)は、この問題を解決する必要があります。問題#6を参照してください。
引用してください
@inproceedings{berman2018lovasz,
title={The Lov{'a}sz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks},
author={Berman, Maxim and Rannen Triki, Amal and Blaschko, Matthew B},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={4413--4421},
year={2018}
}