arXiv reaDer
生または調理済み? RAW 画像のオブジェクト検出
Raw or Cooked? Object Detection on RAW Images
ディープ ニューラル ネットワークに供給された画像は、通常、いくつかの手作りの画像信号処理 (ISP) 操作を受けており、そのすべてが視覚的に魅力的な画像を生成するように最適化されています。この作業では、RAW 画像表現と比較して、視覚的に魅力的な画像の中間表現が下流のコンピューター ビジョン タスクにとって最適ではないという仮説を調査します。代わりに、トレーニング中に操作のパラメーターを共同で学習することにより、ISP の操作を最終タスクに向けて最適化することをお勧めします。このトピックに関する以前の作業を拡張し、以前の作業と従来の RGB 画像の両方と比較して、オブジェクト検出器が優れたパフォーマンスを達成できるようにする新しい学習可能な操作を提案します。オープンな PASCALRAW データセットでの実験では、経験的に仮説を確認しました。
Images fed to a deep neural network have in general undergone several handcrafted image signal processing (ISP) operations, all of which have been optimized to produce visually pleasing images. In this work, we investigate the hypothesis that the intermediate representation of visually pleasing images is sub-optimal for downstream computer vision tasks compared to the RAW image representation. We suggest that the operations of the ISP instead should be optimized towards the end task, by learning the parameters of the operations jointly during training. We extend previous works on this topic and propose a new learnable operation that enables an object detector to achieve superior performance when compared to both previous works and traditional RGB images. In experiments on the open PASCALRAW dataset, we empirically confirm our hypothesis.
updated: Thu Mar 02 2023 18:50:45 GMT+0000 (UTC)
published: Sat Jan 21 2023 15:42:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト