arXiv reaDer
表現学習のための相互情報最大化について
On Mutual Information Maximization for Representation Learning
データの異なるビュー間の相互情報(MI)の推定値を最大化することにより、教師なしまたは自己教師付き表現学習の多くの最近の方法は、特徴抽出器を訓練します。これにはいくつかの差し迫った問題があります。たとえば、MIは推定が難しいことで有名であり、MIを表現学習の目的として使用すると、任意の可逆変換の下での不変性により非常に絡み合った表現につながる可能性があります。それにもかかわらず、これらの方法は実際に優れていることが繰り返し示されています。この論文では、これらの方法の成功はMIの特性だけに起因するものではなく、特徴抽出アーキテクチャの選択と採用されるパラメータ化の両方の帰納的バイアスに強く依存するという議論と経験的証拠を提供しますMI推定量。最後に、ディープメトリックラーニングとの接続を確立し、この解釈が最近導入された方法の成功のもっともらしい説明である可能性があると主張します。
Many recent methods for unsupervised or self-supervised representation learning train feature extractors by maximizing an estimate of the mutual information (MI) between different views of the data. This comes with several immediate problems: For example, MI is notoriously hard to estimate, and using it as an objective for representation learning may lead to highly entangled representations due to its invariance under arbitrary invertible transformations. Nevertheless, these methods have been repeatedly shown to excel in practice. In this paper we argue, and provide empirical evidence, that the success of these methods cannot be attributed to the properties of MI alone, and that they strongly depend on the inductive bias in both the choice of feature extractor architectures and the parametrization of the employed MI estimators. Finally, we establish a connection to deep metric learning and argue that this interpretation may be a plausible explanation for the success of the recently introduced methods.
updated: Thu Jan 23 2020 09:08:54 GMT+0000 (UTC)
published: Wed Jul 31 2019 17:50:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト