Training-Time-Friendly Network for Real-Time Object Detection
 最新のオブジェクト検出器では、トレーニング時間の短縮、推論速度の高速化、高精度の同時達成はめったにありません。それらの間のバランスをとるために、私たちはトレーニングタイムフレンドリーネットワーク(TTFNet)を提案します。この作業では、高速の推論速度を可能にするライトヘッド、シングルステージ、およびアンカーのない設計から始めます。次に、トレーニング時間の短縮に焦点を当てます。注釈付きボックスからより多くのトレーニングサンプルをエンコードすることは、バッチサイズの増加と同様の役割を果たし、学習率を高め、トレーニングプロセスを加速するのに役立ちます。このため、ガウスカーネルを使用してトレーニングサンプルをエンコードする新しいアプローチを紹介します。さらに、情報活用を改善するためのイニシアチブサンプルの重みを設計します。 MS COCOでの実験は、TTFNetがトレーニング時間、推論速度、および精度のバランスをとることで大きな利点があることを示しています。最先端のパフォーマンスを維持しながら、以前のリアルタイム検出器に比べてトレーニング時間が7倍以上短縮されました。さらに、TTFNet-18およびTTFNet-53の超高速バージョンは、それぞれトレーニング時間の10分の1未満でSSD300およびYOLOv3を上回ることができます。コードはで入手できます。
Modern object detectors can rarely achieve short training time, fast inference speed, and high accuracy at the same time. To strike a balance among them, we propose the Training-Time-Friendly Network (TTFNet). In this work, we start with light-head, single-stage, and anchor-free designs, which enable fast inference speed. Then, we focus on shortening training time. We notice that encoding more training samples from annotated boxes plays a similar role as increasing batch size, which helps enlarge the learning rate and accelerate the training process. To this end, we introduce a novel approach using Gaussian kernels to encode training samples. Besides, we design the initiative sample weights for better information utilization. Experiments on MS COCO show that our TTFNet has great advantages in balancing training time, inference speed, and accuracy. It has reduced training time by more than seven times compared to previous real-time detectors while maintaining state-of-the-art performances. In addition, our super-fast version of TTFNet-18 and TTFNet-53 can outperform SSD300 and YOLOv3 by less than one-tenth of their training time, respectively. The code has been made available at
updated: Sun Nov 24 2019 08:08:22 GMT+0000 (UTC)
published: Mon Sep 02 2019 12:59:18 GMT+0000 (UTC)
