arXiv reaDer
マルチラベル分類の非対称損失
Asymmetric Loss For Multi-Label Classification
一般的なマルチラベル設定では、画像には平均して少数のポジティブラベルと多くのネガティブラベルが含まれます。この正負の不均衡が最適化プロセスを支配し、トレーニング中に正のラベルからの勾配を強調しすぎて、精度が低下する可能性があります。この論文では、正と負のサンプルで異なる動作をする新しい非対称損失( "ASL")を紹介します。この損失により、簡単なネガティブサンプルを動的にダウンウェイトし、ハードスレッショルドにすると同時に、誤ってラベル付けされた可能性のあるサンプルを破棄することができます。 ASLがさまざまなサンプルの確率のバランスをとる方法と、このバランスがより良いmAPスコアに変換される方法を示します。 ASLを使用すると、MS-COCO、Pascal-VOC、NUS-WIDE、OpenImagesなどの複数の一般的なマルチラベルデータセットで最先端の結果を得ることができます。また、単一ラベル分類やオブジェクト検出などの他のタスクへのASLの適用性も示します。 ASLは効果的で、実装が簡単で、トレーニング時間や複雑さを増すことはありません。実装はhttps://github.com/Alibaba-MIIL/ASLで入手できます。
In a typical multi-label setting, a picture contains on average few positive labels, and many negative ones. This positive-negative imbalance dominates the optimization process, and can lead to under-emphasizing gradients from positive labels during training, resulting in poor accuracy. In this paper, we introduce a novel asymmetric loss ("ASL"), which operates differently on positive and negative samples. The loss enables to dynamically down-weights and hard-thresholds easy negative samples, while also discarding possibly mislabeled samples. We demonstrate how ASL can balance the probabilities of different samples, and how this balancing is translated to better mAP scores. With ASL, we reach state-of-the-art results on multiple popular multi-label datasets: MS-COCO, Pascal-VOC, NUS-WIDE and Open Images. We also demonstrate ASL applicability for other tasks, such as single-label classification and object detection. ASL is effective, easy to implement, and does not increase the training time or complexity. Implementation is available at: https://github.com/Alibaba-MIIL/ASL.
updated: Thu Mar 18 2021 06:54:56 GMT+0000 (UTC)
published: Tue Sep 29 2020 16:08:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト