arXiv reaDer
機械的モード接続
Mechanistic Mode Connectivity
ニューラル ネットワークは、疑似属性の識別に役立つ学習メカニズムに偏っていることが知られており、分布シフトの下で十分に一般化されない特徴が得られます。この制限を理解して対処するために、モード接続性のレンズを通してニューラル ネットワーク損失ランドスケープのジオメトリを研究します。これは、ニューラル ネットワークの最小化機能が低損失の単純なパスを介して接続されているという観察です。私たちの仕事は2つの質問に取り組んでいます. (ii) 事前トレーニング済みのモデルを微調整すると、そのような最小化ツールを切り替えるのに役立ちますか?メカニズムの類似性の概念を定義し、2 つの最小値間の線形接続の欠如は、対応するモデルが予測を行うために異なるメカニズムを使用することを意味することを示します。このプロパティは、ナイーブな微調整ではモデルの偽属性への依存を排除できない可能性があることを示すのに役立ちます。したがって、接続ベースの微調整と呼ばれるモデルのメカニズムを変更する方法を提案し、偽の属性に対して不変なモデルを誘導することにより、その有用性を検証します。
Neural networks are known to be biased towards learning mechanisms that help identify spurious attributes, yielding features that do not generalize well under distribution shifts. To understand and address this limitation, we study the geometry of neural network loss landscapes through the lens of mode connectivity, the observation that minimizers of neural networks are connected via simple paths of low loss. Our work addresses two questions: (i) do minimizers that encode dissimilar mechanisms connect via simple paths of low loss? (ii) can fine-tuning a pretrained model help switch between such minimizers? We define a notion of mechanistic similarity and demonstrate that lack of linear connectivity between two minimizers implies the corresponding models use dissimilar mechanisms for making their predictions. This property helps us demonstrate that naïve fine-tuning can fail to eliminate a model's reliance on spurious attributes. We thus propose a method for altering a model's mechanisms, named connectivity-based fine-tuning, and validate its usefulness by inducing models invariant to spurious attributes.
updated: Tue Nov 15 2022 18:58:28 GMT+0000 (UTC)
published: Tue Nov 15 2022 18:58:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト