arXiv reaDer
正規化された混合モデルによるエンドツーエンドのマルチオブジェクト検出
End-to-End Multi-Object Detection with a Regularized Mixture Model
最近のエンドツーエンドのマルチオブジェクト検出器は、非最大抑制 (NMS) などの手作りのプロセスを削除することで、推論パイプラインを簡素化します。ただし、トレーニング中は、ヒューリスティックと手作りのプロセスに大きく依存しているため、予測される信頼スコアの信頼性が低下します。この論文では、負の対数尤度 (NLL) と正則化項の 2 つの項だけで構成されるエンドツーエンドのマルチオブジェクト検出器をトレーニングするための新しいフレームワークを提案します。そうすることで、複数オブジェクト検出の問題は、正則化された混合密度モデルを利用したグラウンド トゥルース バウンディング ボックスの密度推定として扱われます。正則化された混合モデル (D-RMM) を使用した提案されたエンドツーエンドのマルチオブジェクト検出は、提案された正則化項である最大成分最大化 (MCM) 損失で NLL を最小化し、予測の重複を防ぐことによってトレーニングされます。私たちの方法は、トレーニングプロセスのヒューリスティックを減らし、予測された信頼スコアの信頼性を向上させます。さらに、当社の D-RMM は、MS COCO データセットの以前のエンドツーエンド検出器よりも優れています。
Recent end-to-end multi-object detectors simplify the inference pipeline by removing hand-crafted processes such as non-maximum suppression (NMS). However, during training, they still heavily rely on heuristics and hand-crafted processes which deteriorate the reliability of the predicted confidence score. In this paper, we propose a novel framework to train an end-to-end multi-object detector consisting of only two terms: negative log-likelihood (NLL) and a regularization term. In doing so, the multi-object detection problem is treated as density estimation of the ground truth bounding boxes utilizing a regularized mixture density model. The proposed end-to-end multi-object Detection with a Regularized Mixture Model (D-RMM) is trained by minimizing the NLL with the proposed regularization term, maximum component maximization (MCM) loss, preventing duplicate predictions. Our method reduces the heuristics of the training process and improves the reliability of the predicted confidence score. Moreover, our D-RMM outperforms the previous end-to-end detectors on MS COCO dataset.
updated: Fri Apr 28 2023 06:08:12 GMT+0000 (UTC)
published: Wed May 18 2022 04:20:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト