arXiv reaDer
LOTR:ローカリゼーショントランスフォーマーを使用した顔のランドマークローカリゼーション
LOTR: Face Landmark Localization Using Localization Transformer
このペーパーでは、Localization Transformer(LOTR)という名前の新しいTransformerベースの顔のランドマークローカリゼーションネットワークを紹介します。提案されたフレームワークは、トランスフォーマーネットワークを活用して特徴マップの空間情報をより有効に活用する直接座標回帰アプローチです。 LOTRモデルは、3つの主要なモジュールで構成されます。1)入力画像を特徴マップに変換するビジュアルバックボーン、2)ビジュアルバックボーンからの特徴表現を改善するTransformerモジュール、3)直接予測するランドマーク予測ヘッドTransformerの表現からのランドマーク座標。トリミングされて位置合わせされた顔画像が与えられると、提案されたLOTRは、後処理ステップを必要とせずにエンドツーエンドでトレーニングできます。また、この論文では、翼損失の勾配の不連続性に対処する滑らかな翼損失関数を紹介し、L1、L2、翼損失などの標準的な損失関数よりも優れた収束を実現します。 106ポイントの顔のランドマークローカリゼーションの最初のグランドチャレンジによって提供されたJDランドマークデータセットの実験結果は、リーダーボード上の既存の方法と2つの最近のヒートマップベースのアプローチに対するLOTRの優位性を示しています。
This paper presents a novel Transformer-based facial landmark localization network named Localization Transformer (LOTR). The proposed framework is a direct coordinate regression approach leveraging a Transformer network to better utilize the spatial information in the feature map. An LOTR model consists of three main modules: 1) a visual backbone that converts an input image into a feature map, 2) a Transformer module that improves the feature representation from the visual backbone, and 3) a landmark prediction head that directly predicts the landmark coordinates from the Transformer's representation. Given cropped-and-aligned face images, the proposed LOTR can be trained end-to-end without requiring any post-processing steps. This paper also introduces the smooth-Wing loss function, which addresses the gradient discontinuity of the Wing loss, leading to better convergence than standard loss functions such as L1, L2, and Wing loss. Experimental results on the JD landmark dataset provided by the First Grand Challenge of 106-Point Facial Landmark Localization indicate the superiority of LOTR over the existing methods on the leaderboard and two recent heatmap-based approaches.
updated: Tue Sep 21 2021 09:54:27 GMT+0000 (UTC)
published: Tue Sep 21 2021 09:54:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト