arXiv reaDer
位置エネルギーランキングとのドメイン無相関
Domain Decorrelation with Potential Energy Ranking
機械学習システム、特に深層学習に基づく方法は、実験的な設定の下で最新のコンピュータービジョンタスクで大きな成功を収めています。一般に、これらの古典的な深層学習方法は、トレーニングデータとテストデータが独立して同一に類似した分布から抽出されると仮定して、iidの仮定に基づいて構築されています。ただし、前述のiidの仮定は、実際のシナリオでは一般に利用できず、その結果、深層学習アルゴリズムのパフォーマンスが急激に低下します。この背後にあるドメインシフトは、非難されるべき主要な要因の1つです。この問題に取り組むために、位置エネルギーランキング(PoER)を使用して、特定の画像のオブジェクト機能とドメイン機能(つまり、外観機能)を分離し、ラベル識別機能の学習を促進すると同時に、それらの間の無関係な相関関係を除外することを提案します。オブジェクトと背景。 PoERは、ニューラルネットワークが最初に浅い層にドメイン情報を含むラベル関連の特徴をキャプチャし、次にラベル識別表現を徐々に抽出するのを支援し、ニューラルネットワークがオブジェクトと背景の特性を認識するように強制します。ドメイン不変の特徴の生成。 PoERは、ドメイン一般化ベンチマークで優れたパフォーマンスを報告し、既存の方法と比較して、トップ1の平均精度を少なくとも1.20%向上させます。さらに、ECCV 2022 NICOチャレンジhttps://nicochallenge.comでPoERを使用し、バニラのResNet-18だけでトップの座を獲得しています。コードはhttps://github.com/ForeverPs/PoERで入手できます。
Machine learning systems, especially the methods based on deep learning, enjoy great success in modern computer vision tasks under experimental settings. Generally, these classic deep learning methods are built on the i.i.d. assumption, supposing the training and test data are drawn from a similar distribution independently and identically. However, the aforementioned i.i.d. assumption is in general unavailable in the real-world scenario, and as a result, leads to sharp performance decay of deep learning algorithms. Behind this, domain shift is one of the primary factors to be blamed. In order to tackle this problem, we propose using Potential Energy Ranking (PoER) to decouple the object feature and the domain feature (i.e., appearance feature) in given images, promoting the learning of label-discriminative features while filtering out the irrelevant correlations between the objects and the background. PoER helps the neural networks to capture label-related features which contain the domain information first in shallow layers and then distills the label-discriminative representations out progressively, enforcing the neural networks to be aware of the characteristic of objects and background which is vital to the generation of domain-invariant features. PoER reports superior performance on domain generalization benchmarks, improving the average top-1 accuracy by at least 1.20% compared to the existing methods. Moreover, we use PoER in the ECCV 2022 NICO Challengehttps://nicochallenge.com, achieving top place with only a vanilla ResNet-18. The code has been made available at https://github.com/ForeverPs/PoER.
updated: Mon Jul 25 2022 13:33:53 GMT+0000 (UTC)
published: Mon Jul 25 2022 13:33:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト