arXiv reaDer
深い分類器の多項式ネットワーク
Polynomial Networks in Deep Classifiers
ディープニューラルネットワークは、オブジェクトや音声の認識などの分類タスクの成功の背後にある原動力となっています。印象的な結果と一般化は、最近提案されたさまざまなアーキテクチャによって達成されましたが、その大部分は一見切り離されているようです。この作業では、統一フレームワークの下で深い分類器の研究をキャストします。特に、入力のさまざまな次数の多項式の形式で、最先端のアーキテクチャ(たとえば、残差ネットワークと非ローカルネットワーク)を表現します。私たちのフレームワークは、各モデルの誘導バイアスに関する洞察を提供し、それらの多項式の性質に基づいて自然な拡張を可能にします。提案されたモデルの有効性は、標準的な画像と音声の分類ベンチマークで評価されます。提案されたモデルの表現力は、モデルのパフォーマンスの向上とモデルの圧縮の両方の観点から強調されています。最後に、この分類法で許可されている拡張機能は、限られたデータとロングテールのデータ分布が存在する場合の利点を示しています。この分類法は、既存のドメイン固有のアーキテクチャ間のリンクを提供することを期待しています。
Deep neural networks have been the driving force behind the success in classification tasks, e.g., object and audio recognition. Impressive results and generalization have been achieved by a variety of recently proposed architectures, the majority of which are seemingly disconnected. In this work, we cast the study of deep classifiers under a unifying framework. In particular, we express state-of-the-art architectures (e.g., residual and non-local networks) in the form of different degree polynomials of the input. Our framework provides insights on the inductive biases of each model and enables natural extensions building upon their polynomial nature. The efficacy of the proposed models is evaluated on standard image and audio classification benchmarks. The expressivity of the proposed models is highlighted both in terms of increased model performance as well as model compression. Lastly, the extensions allowed by this taxonomy showcase benefits in the presence of limited data and long-tailed data distributions. We expect this taxonomy to provide links between existing domain-specific architectures.
updated: Fri Apr 16 2021 06:41:20 GMT+0000 (UTC)
published: Fri Apr 16 2021 06:41:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト