arXiv reaDer
機械的モード接続
Mechanistic Mode Connectivity
モード接続のレンズを通してニューラル ネットワークの損失状況を研究します。これは、データセットでのトレーニングを介して取得されたニューラル ネットワークの最小値が低損失の単純なパスを介して接続されているという観察です。具体的には、次の質問をします。低損失の単純なパスを介して予測を接続するために、さまざまなメカニズムに依存する最小化者はいますか?入力変換に対する共有不変性として機構的類似性の定義を提供し、2 つのモデル間の線形接続の欠如は、予測を行うために異なるメカニズムを使用することを意味することを示します。実践に関連して、この結果は、下流のデータセットに対する単純な微調整がモデルのメカニズムを変更できないことを示すのに役立ちます。たとえば、微調整はモデルの偽の属性への依存を排除できない可能性があります。私たちの分析は、コネクティビティベースの微調整 (CBFT) と呼ばれる、モデルのメカニズムの対象を絞った変更の方法も動機付けます。これは、モデルの偽の属性への依存を減らすタスクのために、いくつかの合成データセットを使用して分析します。
We study neural network loss landscapes through the lens of mode connectivity, the observation that minimizers of neural networks retrieved via training on a dataset are connected via simple paths of low loss. Specifically, we ask the following question: are minimizers that rely on different mechanisms for making their predictions connected via simple paths of low loss? We provide a definition of mechanistic similarity as shared invariances to input transformations and demonstrate that lack of linear connectivity between two models implies they use dissimilar mechanisms for making their predictions. Relevant to practice, this result helps us demonstrate that naive fine-tuning on a downstream dataset can fail to alter a model's mechanisms, e.g., fine-tuning can fail to eliminate a model's reliance on spurious attributes. Our analysis also motivates a method for targeted alteration of a model's mechanisms, named connectivity-based fine-tuning (CBFT), which we analyze using several synthetic datasets for the task of reducing a model's reliance on spurious attributes.
updated: Wed Apr 26 2023 04:44:33 GMT+0000 (UTC)
published: Tue Nov 15 2022 18:58:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト