Needles in Haystacks: On Classifying Tiny Objects in Large Images
 医療やハイパースペクトルイメージングなどのいくつかの重要なコンピュータービジョンドメインでは、大きな画像内の小さなオブジェクトの分類が重要です。ただし、画像分類のためのほとんどの畳み込みニューラルネットワーク(CNN)は、大部分が中央の画像位置にある大きなオブジェクトを含むバイアスデータセットを使用して開発されました。古典的なCNNアーキテクチャが小さなオブジェクトの分類に適しているかどうかを評価するために、2つのデータセットを含む包括的なテストベッドを構築します。1つはMNIST数字から、もう1つは組織病理画像から取得します。このテストベッドを使用すると、制御された実験で、広範な信号対雑音比でCNNアーキテクチャのストレステストを行うことができます。 (1)CNNが一般化できない信号対雑音の制限があり、この制限はデータセットのサイズの影響を受けます-データが多いほどパフォーマンスが向上します。ただし、モデルがオブジェクトと画像の比率の逆数で急速にスケールを一般化するために必要なトレーニングデータの量(2)一般に、容量の大きいモデルはより一般化されます。 (3)オブジェクトのおおよそのサイズがわかっている場合、受容野を適応させることは有益です。 (4)S / N比が非常に小さい場合、グローバルプーリング操作の選択は最適化に影響しますが、S / N値が比較的大きい場合、テストされたすべてのグローバルプーリング操作は同様のパフォーマンスを示します。
In some important computer vision domains, such as medical or hyperspectral imaging, we care about the classification of tiny objects in large images. However, most Convolutional Neural Networks (CNNs) for image classification were developed using biased datasets that contain large objects, in mostly central image positions. To assess whether classical CNN architectures work well for tiny object classification we build a comprehensive testbed containing two datasets: one derived from MNIST digits and one from histopathology images. This testbed allows controlled experiments to stress-test CNN architectures with a broad spectrum of signal-to-noise ratios. Our observations indicate that: (1) There exists a limit to signal-to-noise below which CNNs fail to generalize and that this limit is affected by dataset size - more data leading to better performances; however, the amount of training data required for the model to generalize scales rapidly with the inverse of the object-to-image ratio (2) in general, higher capacity models exhibit better generalization; (3) when knowing the approximate object sizes, adapting receptive field is beneficial; and (4) for very small signal-to-noise ratio the choice of global pooling operation affects optimization, whereas for relatively large signal-to-noise values, all tested global pooling operations exhibit similar performance.
updated: Mon Jan 06 2020 13:13:07 GMT+0000 (UTC)
published: Fri Aug 16 2019 15:42:55 GMT+0000 (UTC)
