arXiv reaDer
BIFRNet: 部分的に隠れた画像認識のための脳にヒントを得た特徴復元 DNN
BIFRNet: A Brain-Inspired Feature Restoration DNN for Partially Occluded Image Recognition
部分的に隠れた画像認識 (POIR) の問題は、長い間人工知能の課題でした。 POIR 問題を処理するための一般的な戦略は、分類に遮られていない特徴を使用することです。残念ながら、この戦略は、画像がひどく遮られると効果がなくなります。可視部分は限られた情報しか提供できないためです。神経科学のいくつかの研究により、人間の脳が部分的に遮られた画像を認識するためには、遮られた情報を埋める無モード補完と呼ばれる特徴の復元が不可欠であることが明らかになりました。ただし、機能の復元は一般的に CNN によって無視されます。これが、CNN が POIR 問題に対して効果がない理由である可能性があります。これに着想を得て、POIR 問題を解決するための新しい脳にヒントを得た機能復元ネットワーク (BIFRNet) を提案します。画像の特徴を抽出するための腹側視覚経路と、遮蔽された画像領域と可視画像領域を区別するための背側視覚経路を模倣します。さらに、知識モジュールを使用してオブジェクトの事前知識を保存し、完了モジュールを使用して、目に見える特徴と事前知識に基づいて遮蔽された特徴を復元します。合成および実世界の遮られた画像データセットに関する徹底的な実験は、BIFRNet が POIR 問題の解決において既存の方法よりも優れていることを示しています。特に重度に遮られた画像の場合、BIRFRNet は他の方法を大幅に上回り、人間の脳のパフォーマンスに近くなります。さらに、脳に着想を得た設計により、BIFRNet はより解釈しやすくなっています。
The partially occluded image recognition (POIR) problem has been a challenge for artificial intelligence for a long time. A common strategy to handle the POIR problem is using the non-occluded features for classification. Unfortunately, this strategy will lose effectiveness when the image is severely occluded, since the visible parts can only provide limited information. Several studies in neuroscience reveal that feature restoration which fills in the occluded information and is called amodal completion is essential for human brains to recognize partially occluded images. However, feature restoration is commonly ignored by CNNs, which may be the reason why CNNs are ineffective for the POIR problem. Inspired by this, we propose a novel brain-inspired feature restoration network (BIFRNet) to solve the POIR problem. It mimics a ventral visual pathway to extract image features and a dorsal visual pathway to distinguish occluded and visible image regions. In addition, it also uses a knowledge module to store object prior knowledge and uses a completion module to restore occluded features based on visible features and prior knowledge. Thorough experiments on synthetic and real-world occluded image datasets show that BIFRNet outperforms the existing methods in solving the POIR problem. Especially for severely occluded images, BIRFRNet surpasses other methods by a large margin and is close to the human brain performance. Furthermore, the brain-inspired design makes BIFRNet more interpretable.
updated: Thu Mar 02 2023 14:33:43 GMT+0000 (UTC)
published: Thu Mar 02 2023 14:33:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト