arXiv reaDer
細粒度の頭のポーズの推定に自己教師あり学習をどのように使用できますか?
How Self-Supervised Learning Can be Used for Fine-Grained Head Pose Estimation?
自己教師あり学習(SSL)の最近の進歩は、コンピュータービジョンの分野におけるこれらの方法の能力を示しています。しかし、この進歩は、頭のポーズの推定などのきめ細かいタスクの約束を示すことができませんでした。この記事では、SSLをヘッドポーズの推定にどのように使用できるかという質問に答えようとしました。一般に、SSLを使用する主なアプローチは2つあります。1。ImageNetで事前トレーニングされたウェイトまたはSSLタスクを介して実行できる事前トレーニングされたウェイトを使用します。 2.教師あり学習(SL)タスクに加えて、補助的な共同トレーニングタスクとしてSSLを同時に活用します。この研究では、SSLプレテキストタスクとしてのジグソーパズルと回転の修正バージョンが使用され、提案されたハイブリッドマルチタスク学習(HMTL)に最適なアーキテクチャが見つかりました。最後に、ベースラインとしてHopeNetメソッドが選択され、SSL事前トレーニングとImageNet事前トレーニングがHMTLとSLの両方に与える影響が比較されます。 SLと比較して、HTMLメソッドによってエラー率が最大11%減少しました。さらに、HMTLメソッドは、ランダム、ImageNet、SSLの事前トレーニングウェイトなど、あらゆる種類の初期ウェイトで良好であることを示しました。また、困惑した画像をSLのみに使用した場合、SLとHMTLの間に配置された平均エラー率は、グローバルな空間的特徴と比較してローカルな空間的特徴の重要性を示していることが観察されました。
Recent progress of Self-Supervised Learning (SSL) demonstrates the capability of these methods in computer vision field. However, this progress could not show any promises for fine-grained tasks such as Head Pose estimation. In this article, we have tried to answer a question: How SSL can be used for Head Pose estimation? In general, there are two main approaches to use SSL: 1. Using pre-trained weights which can be done via weights pre-training on ImageNet or via SSL tasks. 2. Leveraging SSL as an auxiliary co-training task besides of Supervised Learning (SL) tasks at the same time. In this study, modified versions of jigsaw puzzling and rotation as SSL pre-text tasks are used and the best architecture for our proposed Hybrid Multi-Task Learning (HMTL) is found. Finally, the HopeNet method as a baseline is selected and the impact of SSL pre-training and ImageNet pre-training on both HMTL and SL are compared. The error rate reduced by the HTML method up to 11% compare to the SL. Moreover, HMTL method showed that it was good with all kinds of initial weights: random, ImageNet and SSL pre-training weights. Also, it was observed, when puzzled images are used for SL alone, the average error rate placed between SL and HMTL which showed the importance of local spatial features compare to global spatial features.
updated: Tue Aug 10 2021 19:34:45 GMT+0000 (UTC)
published: Tue Aug 10 2021 19:34:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト