arXiv reaDer
DRAG:プライバシーを侵害する画像検出のための動的な領域認識GCN
DRAG: Dynamic Region-Aware GCN for Privacy-Leaking Image Detection
ソーシャルメディアで画像を共有する日常の習慣は、プライバシーの漏洩について深刻な問題を引き起こします。この問題に対処するために、プライバシーを漏らす可能性のある画像を自動的に識別することを目的として、プライバシーを漏らす画像の検出が最近研究されています。このタスクの最近の進歩は、事前にトレーニングされたオブジェクト検出器を介して重要なオブジェクトに焦点を合わせ、それらの相関をモデル化することから恩恵を受けています。ただし、これらの方法には2つの制限があります。1)事前にトレーニングされたオブジェクト検出器の能力を超えて、シーン、テクスチャ、オブジェクトなどの他の重要な要素を無視します。 2)オブジェクト間の相関は固定されていますが、固定された相関はすべての画像に適しているわけではありません。制限を克服するために、オブジェクトやその他の重要な要素を含む重要な領域を動的に検出し、入力画像ごとにそれらの相関を適応的にモデル化する動的領域認識グラフ畳み込みネットワーク(DRAG)を提案します。重要な領域を見つけるために、空間的に相関する特徴チャネルをいくつかの領域認識特徴マップにクラスター化します。さらに、自己注意メカニズムとの相関を動的にモデル化し、グラフ畳み込みネットワークを使用して領域間の相互作用を調査します。 DRAGは、プライバシーを侵害する画像検出用の最大のデータセットで87%の精度を達成しました。これは、最新技術よりも10パーセントポイント高くなっています。さらなるケーススタディは、オブジェクトだけでなく、テクスチャなどの他の重要な要素を含む重要な領域を発見したことを示しています。
The daily practice of sharing images on social media raises a severe issue about privacy leakage. To address the issue, privacy-leaking image detection is studied recently, with the goal to automatically identify images that may leak privacy. Recent advance on this task benefits from focusing on crucial objects via pretrained object detectors and modeling their correlation. However, these methods have two limitations: 1) they neglect other important elements like scenes, textures, and objects beyond the capacity of pretrained object detectors; 2) the correlation among objects is fixed, but a fixed correlation is not appropriate for all the images. To overcome the limitations, we propose the Dynamic Region-Aware Graph Convolutional Network (DRAG) that dynamically finds out crucial regions including objects and other important elements, and models their correlation adaptively for each input image. To find out crucial regions, we cluster spatially-correlated feature channels into several region-aware feature maps. Further, we dynamically model the correlation with the self-attention mechanism and explore the interaction among the regions with a graph convolutional network. The DRAG achieved an accuracy of 87% on the largest dataset for privacy-leaking image detection, which is 10 percentage points higher than the state of the art. The further case study demonstrates that it found out crucial regions containing not only objects but other important elements like textures.
updated: Thu Mar 17 2022 06:56:29 GMT+0000 (UTC)
published: Thu Mar 17 2022 06:56:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト