arXiv reaDer
顔のランドマーク検出のためのマルチソース一貫性を備えた教師と学生の非同期学習
Teacher-Student Asynchronous Learning with Multi-Source Consistency for Facial Landmark Detection
ビデオでの大規模な顔のランドマーク検出タスクの注釈コストが高いため、トレーニングに参加するために高品質の疑似ラベルをマイニングするためにセルフトレーニングを使用する半教師ありパラダイムが研究者によって提案されています。ただし、自己トレーニングベースの方法では、サンプル数を徐々に増やしてトレーニングすることが多く、そのパフォーマンスは、追加された疑似ラベル付きサンプルの数によって大きく異なります。本論文では、マルチソース監視信号整合性基準に基づく教師と生徒の非同期学習〜(TSAL)フレームワークを提案します。これは、整合性制約を通じて疑似ラベルを暗黙的にマイニングします。具体的には、TSALフレームワークには、まったく同じ構造の2つのモデルが含まれています。過激な学生は同じタスクからのマルチソース監視信号を使用してパラメータを更新し、穏やかな教師はシングルソース監視信号を使用してパラメータを更新します。生徒の提案を合理的に吸収するために、教師のパラメータは再帰的な平均フィルタリングによって再度更新されます。実験結果は、非同期学習フレームワークがマルチソース監視信号のノイズを効果的にフィルタリングできることを証明しています。これにより、ネットワークパラメータの更新にとってより重要な疑似ラベルがマイニングされます。また、300W、AFLW、および300VWベンチマークに関する広範な実験により、TSALフレームワークが最先端のパフォーマンスを実現していることが示されています。
Due to the high annotation cost of large-scale facial landmark detection tasks in videos, a semi-supervised paradigm that uses self-training for mining high-quality pseudo-labels to participate in training has been proposed by researchers. However, self-training based methods often train with a gradually increasing number of samples, whose performances vary a lot depending on the number of pseudo-labeled samples added. In this paper, we propose a teacher-student asynchronous learning~(TSAL) framework based on the multi-source supervision signal consistency criterion, which implicitly mines pseudo-labels through consistency constraints. Specifically, the TSAL framework contains two models with exactly the same structure. The radical student uses multi-source supervision signals from the same task to update parameters, while the calm teacher uses a single-source supervision signal to update parameters. In order to reasonably absorb student's suggestions, teacher's parameters are updated again through recursive average filtering. The experimental results prove that asynchronous-learning framework can effectively filter noise in multi-source supervision signals, thereby mining the pseudo-labels which are more significant for network parameter updating. And extensive experiments on 300W, AFLW, and 300VW benchmarks show that the TSAL framework achieves state-of-the-art performance.
updated: Sat Dec 12 2020 03:23:30 GMT+0000 (UTC)
published: Sat Dec 12 2020 03:23:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト