本論文では、Salient Object Detection(SOD)コンテキストに適用される新しいデータ拡張手法(ANDA)を提案します。文献で提案されている画像の切り取り、回転、反転、サイズ変更などの標準的なデータ増強手法は、既存の例のバリエーションのみを生成し、限定的な一般化を提供します。この方法は、オブジェクトを新しい背景と組み合わせながら、この新しいコンテキストでその顕著性の一部を保持することにより、新しい画像を作成するという新規性を持っています。これを行うために、ANDA手法は、ラベル付きの顕著なオブジェクトと、イメージ修復と呼ばれるプロセスで元の顕著なオブジェクトを削除することによって生成される新しい背景との間の線形結合に依存します。提案された手法により、背景情報を保持しながら、オブジェクトの位置とサイズをより正確に制御できます。提案手法を評価することを目的として、複数のディープニューラルネットワークをトレーニングし、各手法での手法の効果を比較しました。また、この方法を他のデータ増強手法と比較しました。ネットワークの改善によっては、Fメジャーで最大14.1%、平均絶対誤差で最大2.6%の減衰になることがわかっています。
In this paper, we propose a novel data augmentation technique (ANDA) applied to the Salient Object Detection (SOD) context. Standard data augmentation techniques proposed in the literature, such as image cropping, rotation, flipping, and resizing, only generate variations of the existing examples, providing a limited generalization. Our method has the novelty of creating new images, by combining an object with a new background while retaining part of its salience in this new context; To do so, the ANDA technique relies on the linear combination between labeled salient objects and new backgrounds, generated by removing the original salient object in a process known as image inpainting. Our proposed technique allows for more precise control of the object's position and size while preserving background information. Aiming to evaluate our proposed method, we trained multiple deep neural networks and compared the effect that our technique has in each one. We also compared our method with other data augmentation techniques. Our findings show that depending on the network improvement can be up to 14.1% in the F-measure and decay of up to 2.6% in the Mean Absolute Error.