Understanding the Effects of Pre-Training for Object Detectors via Eigenspectrum
  ImageNetの事前トレーニングは、正確なオブジェクト検出器を長期間トレーニングするために不可欠であると見なされてきました。最近、ランダムに初期化された重みからトレーニングされたオブジェクト検出器は、ImageNetの事前トレーニングされたモデルから微調整されたものと同等であることが示されています。ただし、事前トレーニングの効果と事前トレーニングによる違いはまだ完全には理解されていません。この論文では、オブジェクト検出器の各特徴マップの共分散行列の固有スペクトルのダイナミクスを分析します。 ResNet-50、FPNを使用したFaster R-CNN、およびMask R-CNNの分析に基づいて、ImageNet事前トレーニングモデルからトレーニングされたオブジェクト検出器と、ゼロからトレーニングされたオブジェクト検出器は、両方のオブジェクト検出器が同様の精度。さらに、固有スペクトルに基づいて物体検出器の幅(チャネル数)を自動的に決定する方法を提案します。ランダムに初期化された重みからFPNを使用してFaster R-CNNをトレーニングし、このメソッドが積和演算を増やして精度を失うことなく、ResNet-50のパラメーターの〜27%を削減できることを示します。結果は、画像分類からオブジェクト検出(またはその他のタスク)に知識を転送するためのより適切な方法を開発する必要があることを示しています。
ImageNet pre-training has been regarded as essential for training accurate object detectors for a long time. Recently, it has been shown that object detectors trained from randomly initialized weights can be on par with those fine-tuned from ImageNet pre-trained models. However, the effects of pre-training and the differences caused by pre-training are still not fully understood. In this paper, we analyze the eigenspectrum dynamics of the covariance matrix of each feature map in object detectors. Based on our analysis on ResNet-50, Faster R-CNN with FPN, and Mask R-CNN, we show that object detectors trained from ImageNet pre-trained models and those trained from scratch behave differently from each other even if both object detectors have similar accuracy. Furthermore, we propose a method for automatically determining the widths (the numbers of channels) of object detectors based on the eigenspectrum. We train Faster R-CNN with FPN from randomly initialized weights, and show that our method can reduce ~27% of the parameters of ResNet-50 without increasing Multiply-Accumulate operations and losing accuracy. Our results indicate that we should develop more appropriate methods for transferring knowledge from image classification to object detection (or other tasks).
updated: Mon Sep 09 2019 17:59:11 GMT+0000 (UTC)
published: Mon Sep 09 2019 17:59:11 GMT+0000 (UTC)
