arXiv reaDer
分布外の一般化のための不確実性モデリング
Uncertainty Modeling for Out-of-Distribution Generalization
さまざまなビジョンタスクで目覚ましい進歩が達成されましたが、分布外のシナリオでテストした場合、ディープニューラルネットワークは依然として明らかなパフォーマンスの低下に苦しんでいます。トレーニングデータのドメイン特性を保持する特徴統計(平均および標準偏差)を適切に操作して、深層学習モデルの一般化能力を向上させることができると主張します。一般的な方法では、機能統計を学習した機能から測定された決定論的値と見なすことが多く、テスト中の潜在的なドメインシフトによって引き起こされる不確実な統計の不一致を明示的に考慮しません。この論文では、トレーニング中に合成された特徴統計を使用してドメインシフトの不確実性をモデル化することにより、ネットワークの一般化能力を向上させます。具体的には、潜在的な不確実性を考慮した後、特徴統計が多変量ガウス分布に従うと仮定します。したがって、各特徴統計はもはや決定論的値ではなく、多様な分布の可能性を持つ確率的ポイントです。不確実な機能統計を使用して、ドメインの摂動を軽減し、潜在的なドメインシフトに対する堅牢性を向上させるようにモデルをトレーニングできます。私たちの方法は、追加のパラメータなしでネットワークに簡単に統合できます。広範な実験は、提案された方法が、画像分類、セマンティックセグメンテーション、インスタンス検索など、複数の視覚タスクでのネットワーク一般化能力を一貫して改善することを示しています。コードはhttps://github.com/lixiaotong97/DSUで入手できます。
Though remarkable progress has been achieved in various vision tasks, deep neural networks still suffer obvious performance degradation when tested in out-of-distribution scenarios. We argue that the feature statistics (mean and standard deviation), which carry the domain characteristics of the training data, can be properly manipulated to improve the generalization ability of deep learning models. Common methods often consider the feature statistics as deterministic values measured from the learned features and do not explicitly consider the uncertain statistics discrepancy caused by potential domain shifts during testing. In this paper, we improve the network generalization ability by modeling the uncertainty of domain shifts with synthesized feature statistics during training. Specifically, we hypothesize that the feature statistic, after considering the potential uncertainties, follows a multivariate Gaussian distribution. Hence, each feature statistic is no longer a deterministic value, but a probabilistic point with diverse distribution possibilities. With the uncertain feature statistics, the models can be trained to alleviate the domain perturbations and achieve better robustness against potential domain shifts. Our method can be readily integrated into networks without additional parameters. Extensive experiments demonstrate that our proposed method consistently improves the network generalization ability on multiple vision tasks, including image classification, semantic segmentation, and instance retrieval. The code can be available at https://github.com/lixiaotong97/DSU.
updated: Fri Apr 22 2022 03:10:41 GMT+0000 (UTC)
published: Tue Feb 08 2022 16:09:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト