arXiv reaDer
チャネル交換によるディープマルチモーダルフュージョン
Deep Multimodal Fusion by Channel Exchanging
分類または回帰に複数のデータソースを使用することによる深いマルチモーダル融合は、さまざまなアプリケーションでユニモーダル対応物よりも明らかな利点を示しています。それでも、集約ベースおよびアライメントベースの融合を含む現在の方法は、モード間融合とモーダル内処理の間のトレードオフのバランスをとるにはまだ不十分であり、パフォーマンス改善のボトルネックが発生します。この目的のために、この論文は、異なるモダリティのサブネットワーク間でチャネルを動的に交換するパラメータのないマルチモーダル融合フレームワークであるチャネル交換ネットワーク(CEN)を提案します。具体的には、チャネル交換プロセスは、トレーニング中のバッチ正規化(BN)スケーリング係数の大きさによって測定される個々のチャネルの重要性によって自己誘導されます。このような交換プロセスの有効性は、畳み込みフィルターを共有しながら、モダリティ間で個別のBNレイヤーを維持することによっても保証されます。これにより、アドオンの利点として、マルチモーダルアーキテクチャをユニモーダルネットワークとほぼ同じくらいコンパクトにすることができます。 RGB-Dデータを介したセマンティックセグメンテーションとマルチドメイン入力を介した画像変換に関する広範な実験により、現在の最先端の方法と比較したCENの有効性が検証されます。詳細なアブレーション研究も実施されており、これは私たちが提案する各コンポーネントの利点を確かに確認しています。私たちのコードはhttps://github.com/yikaiw/CENで入手できます。
Deep multimodal fusion by using multiple sources of data for classification or regression has exhibited a clear advantage over the unimodal counterpart on various applications. Yet, current methods including aggregation-based and alignment-based fusion are still inadequate in balancing the trade-off between inter-modal fusion and intra-modal processing, incurring a bottleneck of performance improvement. To this end, this paper proposes Channel-Exchanging-Network (CEN), a parameter-free multimodal fusion framework that dynamically exchanges channels between sub-networks of different modalities. Specifically, the channel exchanging process is self-guided by individual channel importance that is measured by the magnitude of Batch-Normalization (BN) scaling factor during training. The validity of such exchanging process is also guaranteed by sharing convolutional filters yet keeping separate BN layers across modalities, which, as an add-on benefit, allows our multimodal architecture to be almost as compact as a unimodal network. Extensive experiments on semantic segmentation via RGB-D data and image translation through multi-domain input verify the effectiveness of our CEN compared to current state-of-the-art methods. Detailed ablation studies have also been carried out, which provably affirm the advantage of each component we propose. Our code is available at https://github.com/yikaiw/CEN.
updated: Tue Nov 10 2020 09:53:20 GMT+0000 (UTC)
published: Tue Nov 10 2020 09:53:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト