arXiv reaDer
弱い監視による人と物体の相互作用の検出
Human-Object Interaction Detection via Weak Supervision
この論文の目的は、人間と物体の相互作用(HO-I)の検出です。 HO-I検出は、相互作用する人間と物体の領域を見つけ、それらの相互作用を画像から分類することを目的としています。研究者は、[5]からの強力なHO-Iアライメント監視に依存することにより、近年大幅な改善を得ています。 HO-Iアライメント監視は、人間と相互作用するオブジェクトをペアにし、次に人間とオブジェクトのペアを相互作用カテゴリと整列させます。このような注釈の収集には費用がかかるため、この論文では、アライメントの監視なしでHO-Iを検出することを提案します。代わりに、画像レベルの監視に依存しています。この監視では、画像内の既存のインタラクションのみを列挙し、発生場所を指定しません。私たちの論文は3つの貢献をしています。i)画像レベルの監視のみでHO-Iを検出できるビジュアルトランスフォーマーベースのCNNであるAlign-Formerを提案します。 ii)Align-FormerにはHO-Iアライメント層が装備されており、検出器の監視を可能にする適切なターゲットの選択を学習できます。 iii)HICO-DET [5]およびV-COCO [13]でAlign-Formerを評価し、Align-Formerが既存の画像レベルの監視対象HO-I検出器よりも大幅に優れていることを示します(16.14%から4.71%のmAPの改善) HICO-DETで20.85%まで[5])。
The goal of this paper is Human-object Interaction (HO-I) detection. HO-I detection aims to find interacting human-objects regions and classify their interaction from an image. Researchers obtain significant improvement in recent years by relying on strong HO-I alignment supervision from [5]. HO-I alignment supervision pairs humans with their interacted objects, and then aligns human-object pair(s) with their interaction categories. Since collecting such annotation is expensive, in this paper, we propose to detect HO-I without alignment supervision. We instead rely on image-level supervision that only enumerates existing interactions within the image without pointing where they happen. Our paper makes three contributions: i) We propose Align-Former, a visual-transformer based CNN that can detect HO-I with only image-level supervision. ii) Align-Former is equipped with HO-I align layer, that can learn to select appropriate targets to allow detector supervision. iii) We evaluate Align-Former on HICO-DET [5] and V-COCO [13], and show that Align-Former outperforms existing image-level supervised HO-I detectors by a large margin (4.71% mAP improvement from 16.14% to 20.85% on HICO-DET [5]).
updated: Wed Dec 01 2021 13:36:06 GMT+0000 (UTC)
published: Wed Dec 01 2021 13:36:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト