arXiv reaDer
MRL: 注意と畳み込みで混合することを学ぶ
MRL: Learning to Mix with Attention and Convolutions
このホワイトペーパーでは、提供された入力機能を効果的かつ効率的に混合することを目的として開発された、Mixing Regionally and Locally (MRL) という名前のビジョン ドメインの新しいニューラル アーキテクチャ ブロックを紹介します。入力機能のミキシング タスクを、地域スケールとローカル スケールでのミキシングとして分岐します。効率的な混合を実現するために、局所規模の混合には自己注意によって提供されるドメイン全体の受容野と、局所規模の混合には局所規模に制限された畳み込みカーネルを活用します。より具体的には、提案された方法は、定義された領域内のローカル機能に関連付けられた地域機能を混合し、その後、地域機能によって拡張されたローカルスケールの機能混合を行います。実験によると、この自己注意と畳み込みのハイブリッド化により、能力、一般化 (右帰納的バイアス)、および効率が向上することが示されています。同様のネットワーク設定の下では、MRL は、分類、オブジェクト検出、およびセグメンテーション タスクにおいて、対応するものよりも優れているか、同等です。また、MRL ベースのネットワーク アーキテクチャが H&E 組織学データセットの最先端のパフォーマンスを達成することも示します。 Kumar、CoNSep、および CPM-17 データセットでそれぞれ 0.843、0.855、および 0.892 の DICE を達成し、グループ畳み込みなどのレイヤーを組み込んでデータセット固有の一般化を改善することにより、MRL フレームワークによって提供される汎用性を強調しました。
In this paper, we present a new neural architectural block for the vision domain, named Mixing Regionally and Locally (MRL), developed with the aim of effectively and efficiently mixing the provided input features. We bifurcate the input feature mixing task as mixing at a regional and local scale. To achieve an efficient mix, we exploit the domain-wide receptive field provided by self-attention for regional-scale mixing and convolutional kernels restricted to local scale for local-scale mixing. More specifically, our proposed method mixes regional features associated with local features within a defined region, followed by a local-scale features mix augmented by regional features. Experiments show that this hybridization of self-attention and convolution brings improved capacity, generalization (right inductive bias), and efficiency. Under similar network settings, MRL outperforms or is at par with its counterparts in classification, object detection, and segmentation tasks. We also show that our MRL-based network architecture achieves state-of-the-art performance for H&E histology datasets. We achieved DICE of 0.843, 0.855, and 0.892 for Kumar, CoNSep, and CPM-17 datasets, respectively, while highlighting the versatility offered by the MRL framework by incorporating layers like group convolutions to improve dataset-specific generalization.
updated: Tue Aug 30 2022 03:42:29 GMT+0000 (UTC)
published: Tue Aug 30 2022 03:42:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト