arXiv reaDer
深層ニューラル ネットワークの不変性は人間の知覚と一致するか?
Do Invariances in Deep Neural Networks Align with Human Perception?
安全で信頼できるディープ ラーニングの評価基準は、ディープ ニューラル ネットワーク (DNN) の表現によってキャプチャされた不変性が人間とどれだけうまく共有されているかです。これらの不変性を測定する際の課題を特定します。以前の研究では、勾配ベースの方法を使用して、同一に表現された入力 (IRI)、つまり、ニューラル ネットワークの (特定の層で) 同一の表現を持つ入力を生成し、特定のネットワークの不変性を取得していました。ネットワークの不変性が人間の知覚と一致するために必要な基準の 1 つは、その IRI が人間に「似ている」ように見えることです。ただし、以前の作品には要点が混在しています。 DNN の後の層は人間のような不変性を学習しないと主張する人もいますが (jenelle2019metamers)、そうでないことを示しているように見える人もいます (mahendran2014understanding)。 IRI を生成するために使用される損失関数は、ネットワークの不変性に関する要点に大きな影響を与える可能性があり、これらの相反する発見の主な理由であると主張します。 IRI生成損失に関する敵対的正則化を提案します。これは、任意のモデルが人間とほとんど共有されていない不変性を持っているように見えるIRIを見つけます。この証拠に基づいて、人間のような不変性を持つようにモデルを改善する余地があり、さらに、モデル間の意味のある比較を行うには、正則化のない損失を使用して生成された IRI を使用する必要があると主張します。次に、ディープ ラーニング パイプラインのさまざまなコンポーネント (アーキテクチャ、トレーニング ロス、データ拡張など) が、人間とよく一致するモデルの学習にどのように寄与するかについて、詳細な調査を行います。 ℓ_p ボールの敵対的データ拡張による (自己教師あり) コントラスト損失を使用してトレーニングされた残差接続を持つアーキテクチャは、人間と最も一致する不変性を学習する傾向があることがわかりました。
An evaluation criterion for safe and trustworthy deep learning is how well the invariances captured by representations of deep neural networks (DNNs) are shared with humans. We identify challenges in measuring these invariances. Prior works used gradient-based methods to generate identically represented inputs (IRIs), i.e. , inputs which have identical representations (on a given layer) of a neural network, and thus capture invariances of a given network. One necessary criterion for a network's invariances to align with human perception is for its IRIs look `similar` to humans. Prior works, however, have mixed takeaways; some argue that later layers of DNNs do not learn human-like invariances (jenelle2019metamers) yet others seem to indicate otherwise (mahendran2014understanding). We argue that the loss function used to generate IRIs can heavily affect takeaways about invariances of the network and is the primary reason for these conflicting findings. We propose an adversarial regularizer on the IRI generation loss that finds IRIs that make any model appear to have very little shared invariance with humans. Based on this evidence, we argue that there is scope for improving models to have human-like invariances, and further, to have meaningful comparisons between models one should use IRIs generated using the regularizer-free loss. We then conduct an in-depth investigation of how different components (e.g. ~architectures, training losses, data augmentations) of the deep learning pipeline contribute to learning models that have good alignment with humans. We find that architectures with residual connections trained using a (self-supervised) contrastive loss with ℓ_p ball adversarial data augmentation tend to learn invariances that are most aligned with humans.
updated: Tue Aug 16 2022 17:36:09 GMT+0000 (UTC)
published: Mon Nov 29 2021 17:26:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト