A Global-Local Emebdding Module for Fashion Landmark Detection
  ファッションのランドマークを検出することは、視覚的な衣服分析の基本的な手法です。衣服の大きな変化と硬くない変形により、ファッションランドマークのローカライズは、ポーズ、スケール、およびスタイル間で大きな空間的変動に悩まされます。したがって、ランドマークを正確に検出するには、服のコンテキストに関する知識を理解する必要があります。そのために、本論文では、グローバル-ローカル埋め込みモジュールを備えたファッションランドマーク検出ネットワークを提案します。グローバル-ローカル埋め込みモジュールは、長距離の依存関係をキャプチャするための非ローカル操作と、ローカルの近隣関係を採用するためのその後の畳み込み操作に基づいています。この処理により、ネットワークは衣服の画像に関するグローバルおよびローカルの両方のコンテキスト知識を考慮することができます。提案手法には、ファッションランドマーク検出のための高度な深い特徴表現を学習する優れた能力があることを示します。 2つのベンチマークデータセットの実験結果は、提案されたネットワークが最先端の方法よりも優れていることを示しています。コードはで入手できます。
Detecting fashion landmarks is a fundamental technique for visual clothing analysis. Due to the large variation and non-rigid deformation of clothes, localizing fashion landmarks suffers from large spatial variances across poses, scales, and styles. Therefore, understanding contextual knowledge of clothes is required for accurate landmark detection. To that end, in this paper, we propose a fashion landmark detection network with a global-local embedding module. The global-local embedding module is based on a non-local operation for capturing long-range dependencies and a subsequent convolution operation for adopting local neighborhood relations. With this processing, the network can consider both global and local contextual knowledge for a clothing image. We demonstrate that our proposed method has an excellent ability to learn advanced deep feature representations for fashion landmark detection. Experimental results on two benchmark datasets show that the proposed network outperforms the state-of-the-art methods. Our code is available at
