arXiv reaDer
2Dオブジェクト検出における双曲埋め込みについて
On Hyperbolic Embeddings in 2D Object Detection
オブジェクト検出は、ほとんどの場合、ユークリッド空間で定式化されています。ユークリッド空間または球形測地線距離は、オブジェクトクラスのプロトタイプに対する画像領域の類似性を測定します。この作業では、双曲幾何学がオブジェクト分類空間の基礎となる構造とよりよく一致するかどうかを調べます。双曲線分類器を2ステージ、キーポイントベース、およびトランスフォーマーベースのオブジェクト検出アーキテクチャに組み込み、大規模でロングテールのゼロショットオブジェクト検出ベンチマークで評価します。広範な実験的評価では、分類空間の構造に出現するカテゴリクラス階層を観察し、分類エラーを減らし、全体的なオブジェクト検出パフォーマンスを向上させます。
Object detection, for the most part, has been formulated in the euclidean space, where euclidean or spherical geodesic distances measure the similarity of an image region to an object class prototype. In this work, we study whether a hyperbolic geometry better matches the underlying structure of the object classification space. We incorporate a hyperbolic classifier in two-stage, keypoint-based, and transformer-based object detection architectures and evaluate them on large-scale, long-tailed, and zero-shot object detection benchmarks. In our extensive experimental evaluations, we observe categorical class hierarchies emerging in the structure of the classification space, resulting in lower classification errors and boosting the overall object detection performance.
updated: Wed Mar 16 2022 10:43:35 GMT+0000 (UTC)
published: Tue Mar 15 2022 16:43:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト