arXiv reaDer
TransCMD:RGB-D顕著な物体検出用のトランスフォーマーを備えたクロスモーダルデコーダー
TransCMD: Cross-Modal Decoder Equipped with Transformer for RGB-D Salient Object Detection
既存のRGB-D顕著なオブジェクト検出方法のほとんどは、畳み込み演算を利用し、複雑な織り合わせ融合構造を構築して、クロスモーダル情報統合を実現します。畳み込み演算に固有のローカル接続により、畳み込みベースのメソッドのパフォーマンスが制限されます。この作業では、グローバルな情報の調整と変換の観点からこのタスクを再考します。具体的には、提案された方法(TransCMD)は、いくつかのクロスモーダル統合ユニットをカスケード接続して、トップダウンの変圧器ベースの情報伝播パス(TIPP)を構築します。 TransCMDは、マルチスケールおよびマルチモーダル機能の統合を、トランスフォーマー上に構築されたシーケンス間のコンテキスト伝播および更新プロセスとして扱います。さらに、入力トークンの数に関する2次の複雑さを考慮して、許容可能な計算コストでパッチごとのトークン再埋め込み戦略(PTRE)を設計します。 7つのRGB-DSODベンチマークデータセットの実験結果は、TIPPが装備されている場合、単純な2ストリームエンコーダ-デコーダフレームワークが最先端の純粋なCNNベースの方法を超えることができることを示しています。
Most of the existing RGB-D salient object detection methods utilize the convolution operation and construct complex interweave fusion structures to achieve cross-modal information integration. The inherent local connectivity of convolution operation constrains the performance of the convolution-based methods to a ceiling. In this work, we rethink this task from the perspective of global information alignment and transformation. Specifically, the proposed method (TransCMD) cascades several cross-modal integration units to construct a top-down transformer-based information propagation path (TIPP). TransCMD treats the multi-scale and multi-modal feature integration as a sequence-to-sequence context propagation and update process built on the transformer. Besides, considering the quadratic complexity w.r.t. the number of input tokens, we design a patch-wise token re-embedding strategy (PTRE) with acceptable computational cost. Experimental results on seven RGB-D SOD benchmark datasets demonstrate that a simple two-stream encoder-decoder framework can surpass the state-of-the-art purely CNN-based methods when it is equipped with the TIPP.
updated: Sat Dec 04 2021 15:45:34 GMT+0000 (UTC)
published: Sat Dec 04 2021 15:45:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト