従来の浅い表現学習手法と比較して、ディープニューラルネットワークはほぼすべてのアプリケーションベンチマークで優れたパフォーマンスを実現しています。しかし、それらの明確な経験的利点にもかかわらず、それらがそれほど効果的である理由はまだよく理解されていません。この質問にアプローチするために、ディープフレーム近似を導入します。これは、構造化された過剰なフレームを使用した制約付き表現学習のための統合フレームワークです。正確な推論には反復最適化が必要ですが、フィードフォワードディープニューラルネットワークの操作によって近似される場合があります。モデルの容量が、深さ、幅、スキップ接続などのアーキテクチャのハイパーパラメータによって引き起こされるフレーム構造にどのように関連しているかを間接的に分析します。これらの構造の違いを、表現の一意性と安定性にリンクされたデータに依存しないコヒーレンスの尺度であるディープフレームポテンシャルで定量化します。モデル選択の基準として、さまざまな一般的なディープネットワークアーキテクチャとデータセットの汎化誤差との相関関係を示します。また、反復最適化アルゴリズムを実装するリカレントネットワークが、敵対的なロバスト性を向上させながら、フィードフォワード近似に匹敵するパフォーマンスを実現する方法についても説明します。過剰な表現の確立された理論へのこの接続は、アドホックエンジニアリングへの依存度が低い原理的なディープネットワークアーキテクチャ設計の有望な新しい方向性を示唆しています。
In comparison to classical shallow representation learning techniques, deep neural networks have achieved superior performance in nearly every application benchmark. But despite their clear empirical advantages, it is still not well understood what makes them so effective. To approach this question, we introduce deep frame approximation: a unifying framework for constrained representation learning with structured overcomplete frames. While exact inference requires iterative optimization, it may be approximated by the operations of a feed-forward deep neural network. We indirectly analyze how model capacity relates to frame structures induced by architectural hyperparameters such as depth, width, and skip connections. We quantify these structural differences with the deep frame potential, a data-independent measure of coherence linked to representation uniqueness and stability. As a criterion for model selection, we show correlation with generalization error on a variety of common deep network architectures and datasets. We also demonstrate how recurrent networks implementing iterative optimization algorithms can achieve performance comparable to their feed-forward approximations while improving adversarial robustness. This connection to the established theory of overcomplete representations suggests promising new directions for principled deep network architecture design with less reliance on ad-hoc engineering.