arXiv reaDer
BM-NAS:バイレベルマルチモーダルニューラルアーキテクチャ検索
BM-NAS: Bilevel Multimodal Neural Architecture Search
ディープニューラルネットワーク(DNN)は、さまざまなマルチモーダル学習問題で優れたパフォーマンスを示しています。ただし、単峰性の特徴を手動で設計し、多峰性の特徴融合戦略を設計することにより、DNNを個々のマルチモーダルタスクに適応させるために多大な努力が必要になることがよくあります。この論文は、バイレベル検索スキームを介してマルチモーダル融合モデルのアーキテクチャを完全に検索可能にするバイレベルマルチモーダルニューラルアーキテクチャ検索(BM-NAS)フレームワークを提案します。上位レベルでは、BM-NASは、事前にトレーニングされたユニモーダルバックボーンからモード間/モーダル内の機能ペアを選択します。下位レベルでは、BM-NASは、事前定義されたプリミティブ操作の組み合わせである、各機能ペアの融合戦略を学習します。原始的な操作は精巧に設計されており、マルチヘッドアテンション(トランスフォーマー)やアテンションオンアテンション(AoA)などのさまざまな効果的な機能融合モジュールに対応するために柔軟に組み合わせることができます。 3つのマルチモーダルタスクの実験結果は、提案されたBM-NASフレームワークの有効性と効率を示しています。 BM-NASは、既存の一般化されたマルチモーダルNAS手法と比較して、はるかに少ない検索時間と少ないモデルパラメータで競争力のあるパフォーマンスを実現します。
Deep neural networks (DNNs) have shown superior performances on various multimodal learning problems. However, it often requires huge efforts to adapt DNNs to individual multimodal tasks by manually engineering unimodal features and designing multimodal feature fusion strategies. This paper proposes Bilevel Multimodal Neural Architecture Search (BM-NAS) framework, which makes the architecture of multimodal fusion models fully searchable via a bilevel searching scheme. At the upper level, BM-NAS selects the inter/intra-modal feature pairs from the pretrained unimodal backbones. At the lower level, BM-NAS learns the fusion strategy for each feature pair, which is a combination of predefined primitive operations. The primitive operations are elaborately designed and they can be flexibly combined to accommodate various effective feature fusion modules such as multi-head attention (Transformer) and Attention on Attention (AoA). Experimental results on three multimodal tasks demonstrate the effectiveness and efficiency of the proposed BM-NAS framework. BM-NAS achieves competitive performances with much less search time and fewer model parameters in comparison with the existing generalized multimodal NAS methods.
updated: Mon Apr 19 2021 15:09:49 GMT+0000 (UTC)
published: Mon Apr 19 2021 15:09:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト