arXiv reaDer
少数のショットの一人称行動認識のためのドメイン固有の事前確率とメタ学習
Domain-Specific Priors and Meta Learning for Few-Shot First-Person Action Recognition
注釈付きの大規模な実際のデータセットがないため、ビデオアクティビティを理解するために転移学習が必要になります。私たちは、一人称行動分類のための数ショット伝達学習のための効果的な方法を開発することを目指しています。独自にトレーニングされたローカルの視覚的手がかりを活用して、プリミティブアクションラベルを提供するソースドメインから、ほんの一握りの例を使用して別のターゲットドメインに転送できる表現を学習します。私たちが採用する視覚的手がかりには、オブジェクトとオブジェクトの相互作用、手の把握、および手の位置の関数である領域内の動きが含まれます。メタ学習に基づくフレームワークを使用して、展開された視覚的手がかりの特徴的でドメイン不変のコンポーネントを抽出します。これにより、さまざまなシーンおよびアクション構成でキャプチャされたパブリックデータセット間でアクション分類モデルを転送できます。転送学習方法論の比較結果を提示し、クラス間転送とデータセット間転送の両方について、最先端のアクション分類アプローチよりも優れた結果を報告します。
The lack of large-scale real datasets with annotations makes transfer learning a necessity for video activity understanding. We aim to develop an effective method for few-shot transfer learning for first-person action classification. We leverage independently trained local visual cues to learn representations that can be transferred from a source domain, which provides primitive action labels, to a different target domain using only a handful of examples. Visual cues we employ include object-object interactions, hand grasps and motion within regions that are a function of hand locations. We employ a framework based on meta-learning to extract the distinctive and domain invariant components of the deployed visual cues. This enables transfer of action classification models across public datasets captured with diverse scene and action configurations. We present comparative results of our transfer learning methodology and report superior results over state-of-the-art action classification approaches for both inter-class and inter-dataset transfer.
updated: Tue Dec 07 2021 23:33:50 GMT+0000 (UTC)
published: Mon Jul 22 2019 15:52:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト