arXiv reaDer
神経聴診器による直観的な物理学の精査とバイアス解除
Scrutinizing and De-Biasing Intuitive Physics with Neural Stethoscopes
  ブロックタワーの安定性を視覚的に予測することは、直感的な物理学の分野では一般的なタスクです。これまでの研究では、1次元のパフォーマンス測定である予測精度に焦点を当てていましたが、最終モデルの学習された物理的理解と学習プロセスのガイド方法のより広範な分析を提供します。この目的のために、ディープニューラルネットワークにおける特定の影響要因の重要度を定量化し、必要に応じて情報を積極的に促進および抑制するための汎用フレームワークとして、神経聴診器を導入します。そうすることで、マルチタスク学習と補助的および敵対的損失を伴うトレーニングの概念を統一します。安定性予測のための最先端のニューラルネットワークを分析するために、神経聴診器を適用します。ベースラインモデルは、不正確な視覚的手がかりに惑わされやすいことを示します。これにより、視覚的キューが安定性と逆相関するシナリオでトレーニングを行うと、ランダムな推測のレベルまでパフォーマンスが低下します。聴診器を使用して意味のある特徴抽出を促進すると、予測精度が51%から90%に向上します。逆に、視覚的キューが安定性と正の相関関係にある簡単なデータセットでのトレーニングでは、ベースラインモデルは、より困難なデータセットでパフォーマンスの低下につながるバイアスを学習します。敵の聴診器を使用すると、ネットワークのバイアスが正常に解除され、パフォーマンスが66%から88%に向上します。
Visually predicting the stability of block towers is a popular task in the domain of intuitive physics. While previous work focusses on prediction accuracy, a one-dimensional performance measure, we provide a broader analysis of the learned physical understanding of the final model and how the learning process can be guided. To this end, we introduce neural stethoscopes as a general purpose framework for quantifying the degree of importance of specific factors of influence in deep neural networks as well as for actively promoting and suppressing information as appropriate. In doing so, we unify concepts from multitask learning as well as training with auxiliary and adversarial losses. We apply neural stethoscopes to analyse the state-of-the-art neural network for stability prediction. We show that the baseline model is susceptible to being misled by incorrect visual cues. This leads to a performance breakdown to the level of random guessing when training on scenarios where visual cues are inversely correlated with stability. Using stethoscopes to promote meaningful feature extraction increases performance from 51% to 90% prediction accuracy. Conversely, training on an easy dataset where visual cues are positively correlated with stability, the baseline model learns a bias leading to poor performance on a harder dataset. Using an adversarial stethoscope, the network is successfully de-biased, leading to a performance increase from 66% to 88%.
updated: Fri Sep 06 2019 13:49:37 GMT+0000 (UTC)
published: Thu Jun 14 2018 12:35:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト