arXiv reaDer
極端なポーズの顔認識のための情報最大化
Information Maximization for Extreme Pose Face Recognition
この論文では、抽象的な埋め込み空間で正面と横顔の顔画像の間の接続を描画しようとします。結合エンコーダー ネットワークを使用してこの接続を利用し、正面/横顔の顔画像を共通の潜在的な埋め込み空間に投影します。提案されたモデルは、顔の 2 つのビュー間の相互情報を最大化することにより、埋め込み空間内の表現の類似性を強制します。提案された結合エンコーダーは、極度のポーズの不均衡を持つ顔を照合するための 3 つの貢献から恩恵を受けます。まず、ポーズを認識した対照的な学習を活用して、アイデンティティの正面表現とプロファイル表現の間の相互情報を最大化します。次に、過去の反復で蓄積された潜在的な表現で構成されるメモリ バッファーがモデルに統合されるため、ミニバッチ サイズよりもはるかに多くのインスタンスを参照できます。第三に、新しいポーズ認識の敵対的ドメイン適応方法により、モデルはプロファイルから正面表現への非対称マッピングを学習するようになります。私たちのフレームワークでは、結合エンコーダーは、本物の顔と偽者の顔の分布の間のマージンを拡大することを学習します。これにより、同じアイデンティティの異なるビュー間で高い相互情報が得られます。提案されたモデルの有効性は、4 つのベンチマーク データセットに関する広範な実験、評価、アブレーション研究、および説得力のある最先端のアルゴリズムとの比較を通じて調査されます。
In this paper, we seek to draw connections between the frontal and profile face images in an abstract embedding space. We exploit this connection using a coupled-encoder network to project frontal/profile face images into a common latent embedding space. The proposed model forces the similarity of representations in the embedding space by maximizing the mutual information between two views of the face. The proposed coupled-encoder benefits from three contributions for matching faces with extreme pose disparities. First, we leverage our pose-aware contrastive learning to maximize the mutual information between frontal and profile representations of identities. Second, a memory buffer, which consists of latent representations accumulated over past iterations, is integrated into the model so it can refer to relatively much more instances than the mini-batch size. Third, a novel pose-aware adversarial domain adaptation method forces the model to learn an asymmetric mapping from profile to frontal representation. In our framework, the coupled-encoder learns to enlarge the margin between the distribution of genuine and imposter faces, which results in high mutual information between different views of the same identity. The effectiveness of the proposed model is investigated through extensive experiments, evaluations, and ablation studies on four benchmark datasets, and comparison with the compelling state-of-the-art algorithms.
updated: Wed Sep 07 2022 20:30:06 GMT+0000 (UTC)
published: Wed Sep 07 2022 20:30:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト