arXiv reaDer
ダーモスコピー画像の分類と検索のための不変性を持つ回転平均ネットワーク
A Rotation Meanout Network with Invariance for Dermoscopy Image Classification and Retrieval
コンピュータ支援診断 (CAD) システムは、皮膚疾患の臨床診断の参照基準を提供できます。畳み込みニューラル ネットワーク (CNN) は、色や形などの視覚要素だけでなく、セマンティックな特徴も抽出できます。そのため、ダーモスコピー画像の多くのタスクで大幅な改善が行われました。ダーモスコピーの画像には主な向きがなく、データセットに多数の皮膚病変の回転があることを示しています。ただし、CNN には回転不変性がなく、回転に対する CNN の堅牢性に影響を与えます。この問題に取り組むために、ダーモスコピー画像から回転不変の特徴を抽出する回転平均 (RM) ネットワークを提案します。 RM では、回転された特徴マップの各セットは重み共有畳み込みの出力のセットに対応し、それらは最終的な特徴マップを取得するために meanout 戦略を使用して融合されます。理論的導出により、提案されたRMネットワークは回転同変であり、その後にグローバル平均プーリング(GAP)操作が続くと、回転不変の機能を抽出できます。抽出された回転不変の特徴は、ダーモスコピー画像の分類および検索タスクで元のデータをより適切に表すことができます。 RM は一般的な操作であり、ネットワーク構造を変更したり、パラメーターを増やしたりすることはなく、CNN の任意の部分に柔軟に埋め込むことができます。ダーモスコピー画像データセットに対して広範な実験が行われます。結果は、私たちの方法が他の回転防止方法よりも優れており、ダーモスコピー画像の分類および検索タスクで大幅な改善を達成していることを示しており、ダーモスコピー画像の分野における回転不変性の可能性を示しています。
The computer-aided diagnosis (CAD) system can provide a reference basis for the clinical diagnosis of skin diseases. Convolutional neural networks (CNNs) can not only extract visual elements such as colors and shapes but also semantic features. As such they have made great improvements in many tasks of dermoscopy images. The imaging of dermoscopy has no principal orientation, indicating that there are a large number of skin lesion rotations in the datasets. However, CNNs lack rotation invariance, which is bound to affect the robustness of CNNs against rotations. To tackle this issue, we propose a rotation meanout (RM) network to extract rotation-invariant features from dermoscopy images. In RM, each set of rotated feature maps corresponds to a set of outputs of the weight-sharing convolutions and they are fused using meanout strategy to obtain the final feature maps. Through theoretical derivation, the proposed RM network is rotation-equivariant and can extract rotation-invariant features when followed by the global average pooling (GAP) operation. The extracted rotation-invariant features can better represent the original data in classification and retrieval tasks for dermoscopy images. The RM is a general operation, which does not change the network structure or increase any parameter, and can be flexibly embedded in any part of CNNs. Extensive experiments are conducted on a dermoscopy image dataset. The results show our method outperforms other anti-rotation methods and achieves great improvements in dermoscopy image classification and retrieval tasks, indicating the potential of rotation invariance in the field of dermoscopy images.
updated: Wed Nov 02 2022 09:06:47 GMT+0000 (UTC)
published: Mon Aug 01 2022 06:15:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト