arXiv reaDer
データ効率の高いトレーニングとCNNのバイアスの低減による赤外線画像の背景不変分類
Background Invariant Classification on Infrared Imagery by Data Efficient Training and Reducing Bias in CNNs
畳み込みニューラルネットワークは画像内のオブジェクトを非常に正確に分類できますが、ネットワークの注意が必ずしもシーンの意味的に重要な領域にあるとは限らないことはよく知られています。ネットワークは、関心のあるオブジェクトに関連しない背景テクスチャを学習することがよくあります。これにより、ネットワークはバックグラウンドの変動や変化の影響を受けやすくなり、パフォーマンスに悪影響を及ぼします。赤外線画像とRGBデータの両方でCNNのこのバイアスを減らすために、分割トレーニングと呼ばれる新しい2段階のトレーニング手順を提案します。分割トレーニング手順には2つのステップがあります。MSE損失を使用して、最初に背景のある画像でネットワークのレイヤーをトレーニングし、背景のない画像を使用してトレーニングしたときに同じネットワークのアクティブ化と一致させます。次に、これらのレイヤーをフリーズした状態で、クロスエントロピー損失を使用してネットワークの残りの部分をトレーニングし、オブジェクトを分類します。私たちのトレーニング方法は、単純なCNNアーキテクチャと、多くのハードウェアリソースを使用するVGGやDensenetなどのディープCNNの両方で従来のトレーニング手順よりも優れており、背景よりも形状と構造に重点を置いた人間の視覚をより正確に模倣することを学習します。
Even though convolutional neural networks can classify objects in images very accurately, it is well known that the attention of the network may not always be on the semantically important regions of the scene. It has been observed that networks often learn background textures which are not relevant to the object of interest. In turn this makes the networks susceptible to variations and changes in the background which negatively affect their performance. We propose a new two-step training procedure called split training to reduce this bias in CNNs on both Infrared imagery and RGB data. Our split training procedure has two steps: using MSE loss first train the layers of the network on images with background to match the activations of the same network when it is trained using images without background; then with these layers frozen, train the rest of the network with cross-entropy loss to classify the objects. Our training method outperforms the traditional training procedure in both a simple CNN architecture, and deep CNNs like VGG and Densenet which use lots of hardware resources, and learns to mimic human vision which focuses more on shape and structure than background with higher accuracy.
updated: Sat Jan 22 2022 23:29:42 GMT+0000 (UTC)
published: Sat Jan 22 2022 23:29:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト