最近、赤外線による人間の行動の認識は、可視光よりも多くの利点、つまり照明の変化や影に強いという点で注目を集めています。ただし、これまでの赤外線アクションデータは限られているため、赤外線アクション認識のパフォーマンスが低下します。転移学習のアイデアに動機付けられ、可視光からの補助データを使用した赤外線人間行動認識フレームワークが、限られた赤外線行動データの問題を解決するために提案されています。提案されたフレームワークでは、まず、赤外線データと可視光データを共通の特徴空間にマッピングするための斬新なクロスデータセット特徴アライメントと一般化(CDFAG)フレームワークを構築します。ここで、カーネルマニホールドアライメント(KEMA)とデュアルアラインメントから汎用化されたエンコーダー(AGE)モデルは、機能を表すために使用されます。次に、赤外線データと可視光データの両方を使用してサポートベクターマシン(SVM)がトレーニングされ、赤外線データから派生した特徴を分類できます。提案された方法は、公的に利用可能な赤外線人間行動データセットであるInfARで評価されます。補助データを構築するために、新しい可視光アクションデータセットXD145をセットアップしました。実験結果は、提案された方法がいくつかの転送学習およびドメイン適応方法と比較して最先端のパフォーマンスを達成できることを示しています。
Recently, infrared human action recognition has attracted increasing attention for it has many advantages over visible light, that is, being robust to illumination change and shadows. However, the infrared action data is limited until now, which degrades the performance of infrared action recognition. Motivated by the idea of transfer learning, an infrared human action recognition framework using auxiliary data from visible light is proposed to solve the problem of limited infrared action data. In the proposed framework, we first construct a novel Cross-Dataset Feature Alignment and Generalization (CDFAG) framework to map the infrared data and visible light data into a common feature space, where Kernel Manifold Alignment (KEMA) and a dual alignedto-generalized encoders (AGE) model are employed to represent the feature. Then, a support vector machine (SVM) is trained, using both the infrared data and visible light data, and can classify the features derived from infrared data. The proposed method is evaluated on InfAR, which is a publicly available infrared human action dataset. To build up auxiliary data, we set up a novel visible light action dataset XD145. Experimental results show that the proposed method can achieve state-of-the-art performance compared with several transfer learning and domain adaptation methods.