arXiv reaDer
DPPMask: 決定点プロセスによるマスク画像モデリング
DPPMask: Masked Image Modeling with Determinantal Point Processes
マスク イメージ モデリング (MIM) は、ランダムにマスクされたイメージを再構築することを目的として、印象的な代表的なパフォーマンスを達成しました。経験的な成功にもかかわらず、以前の研究のほとんどは、マスクされたオブジェクトなど、モデルに回復を超えた何かを再構築することを強制することは不合理であるという重要な事実を無視してきました.この作業では、以前の作業で広く使用されていた一様ランダム マスキングが不可避的にいくつかの重要なオブジェクトを失い、元のセマンティック情報を変更することを示しています。この問題に対処するために、マスキング後の画像のセマンティックな変化を減らすために、ランダムプロセスを決定点プロセス (DPP) に置き換えることにより、新しいマスキング戦略、つまり DPPMask で MIM を強化します。私たちの方法はシンプルですが効果的であり、さまざまなフレームワーク内で実装された場合、追加の学習可能なパラメーターは必要ありません。特に、2 つの代表的な MIM フレームワークである MAE と iBOT で手法を評価します。 DPPMask は、より低いマスキング率とより高いマスキング率の両方でランダム サンプリングを上回ることを示し、DPPMask が再構成タスクをより合理的にすることを示しています。バックグラウンドチャレンジとマルチクラス分類タスクでメソッドをさらにテストし、さまざまなタスクでメソッドがより堅牢であることを示します。
Masked Image Modeling (MIM) has achieved impressive representative performance with the aim of reconstructing randomly masked images. Despite the empirical success, most previous works have neglected the important fact that it is unreasonable to force the model to reconstruct something beyond recovery, such as those masked objects. In this work, we show that uniformly random masking widely used in previous works unavoidably loses some key objects and changes original semantic information, resulting in a misalignment problem and hurting the representative learning eventually. To address this issue, we augment MIM with a new masking strategy namely the DPPMask by substituting the random process with Determinantal Point Process (DPPs) to reduce the semantic change of the image after masking. Our method is simple yet effective and requires no extra learnable parameters when implemented within various frameworks. In particular, we evaluate our method on two representative MIM frameworks, MAE and iBOT. We show that DPPMask surpassed random sampling under both lower and higher masking ratios, indicating that DPPMask makes the reconstruction task more reasonable. We further test our method on the background challenge and multi-class classification tasks, showing that our method is more robust at various tasks.
updated: Sat Mar 25 2023 08:00:58 GMT+0000 (UTC)
published: Mon Mar 13 2023 13:40:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト