arXiv reaDer
mvHOTA:マルチポイント検出における空間的および時間的関連を測定するためのマルチビュー高次追跡精度メトリック
mvHOTA: A multi-view higher order tracking accuracy metric to measure spatial and temporal associations in multi-point detection
マルチオブジェクトトラッキング(MOT)は、シーン内のオブジェクトを検出し、一連のフレームにわたってそれらを追跡することを含む、やりがいのあるタスクです。このタスクの評価は、一時的なオクルージョンと一連の画像全体での軌道の変化のために困難です。 KITTIなどのデータセットでMOTメソッドをベンチマークするための主な評価指標は、最近、MOTA、DetA、IDF1などの指標よりも優れたパフォーマンスの説明を提供できる高次追跡精度(HOTA)指標になりました。ポイントの検出と追跡は密接に関連するタスクであり、オブジェクト検出の特殊なケースと見なすことができます。ただし、検出タスク自体の評価には違いがあります(ポイント距離とバウンディングボックスのオーバーラップ)。時間ディメンションとマルチビューシナリオを含めると、評価タスクはさらに複雑になります。この作業では、時間的および空間的な関連付けを考慮しながら、マルチポイント(マルチインスタンスおよびマルチクラス)検出の精度を決定するために、マルチビュー高次追跡メトリック(mvHOTA)を提案します。 mvHOTAは、検出、関連付け、および対応の精度の幾何平均として解釈できるため、各要素に等しい重みが与えられます。以前に組織化された医学的課題からの公開されている内視鏡ポイント検出データセットを通じて、ユースケースを示します。さらに、このユースケースの他の調整されたMOTメトリックと比較し、mvHOTAのプロパティについて説明し、提案された対応精度とオクルージョンインデックスがオクルージョンの処理に関するメソッドの分析をどのように容易にするかを示します。コードは公開されます。
Multi-object tracking (MOT) is a challenging task that involves detecting objects in the scene and tracking them across a sequence of frames. Evaluating this task is difficult due to temporal occlusions, and varying trajectories across a sequence of images. The main evaluation metric to benchmark MOT methods on datasets such as KITTI has recently become the higher order tracking accuracy (HOTA) metric, which is capable of providing a better description of the performance over metrics such as MOTA, DetA, and IDF1. Point detection and tracking is a closely related task, which could be regarded as a special case of object detection. However, there are differences in evaluating the detection task itself (point distances vs. bounding box overlap). When including the temporal dimension and multi-view scenarios, the evaluation task becomes even more complex. In this work, we propose a multi-view higher order tracking metric (mvHOTA) to determine the accuracy of multi-point (multi-instance and multi-class) detection, while taking into account temporal and spatial associations. mvHOTA can be interpreted as the geometric mean of the detection, association, and correspondence accuracies, thereby providing equal weighting to each of the factors. We demonstrate a use-case through a publicly available endoscopic point detection dataset from a previously organised medical challenge. Furthermore, we compare with other adjusted MOT metrics for this use-case, discuss the properties of mvHOTA, and show how the proposed correspondence accuracy and the Occlusion index facilitate analysis of methods with respect to handling of occlusions. The code will be made publicly available.
updated: Sun Jun 19 2022 10:31:53 GMT+0000 (UTC)
published: Sun Jun 19 2022 10:31:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト