arXiv reaDer
ローカル空間予測可能性を使用した教師なしオブジェクトキーポイント学習
Unsupervised Object Keypoint Learning using Local Spatial Predictability
オブジェクトのキーポイントに基づく表現学習への新しいアプローチであるPermaKeyを提案します。空間的近隣からのローカル画像領域の予測可能性を活用して、オブジェクトパーツに対応する顕著な領域を識別し、それがキーポイントに変換されます。以前のアプローチとは異なり、予測可能性を利用して、オブジェクトの固有のプロパティであるオブジェクトのキーポイントを検出します。これにより、動き、形状、色など、オブジェクトに固有ではない特性に焦点を合わせるためにキーポイントに過度のバイアスがかからないことが保証されます。最も顕著なオブジェクトパーツに対応するキーポイントを学習するAtariでのPermaKeyの有効性を示します。特定の視覚的注意散漫に対して堅牢です。さらに、AtariドメインのダウンストリームRLタスクでは、背景やディストラクタオブジェクトが移動する困難な環境でも、キーポイントを備えたエージェントが競合する代替手段を使用したエージェントよりも優れていることを示します。
We propose PermaKey, a novel approach to representation learning based on object keypoints. It leverages the predictability of local image regions from spatial neighborhoods to identify salient regions that correspond to object parts, which are then converted to keypoints. Unlike prior approaches, it utilizes predictability to discover object keypoints, an intrinsic property of objects. This ensures that it does not overly bias keypoints to focus on characteristics that are not unique to objects, such as movement, shape, colour etc. We demonstrate the efficacy of PermaKey on Atari where it learns keypoints corresponding to the most salient object parts and is robust to certain visual distractors. Further, on downstream RL tasks in the Atari domain we demonstrate how agents equipped with our keypoints outperform those using competing alternatives, even on challenging environments with moving backgrounds or distractor objects.
updated: Wed Nov 25 2020 18:27:05 GMT+0000 (UTC)
published: Wed Nov 25 2020 18:27:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト