ファッション衣料を分析する深いネットワークの開発には、多くの実際のアプリケーションがあります。すべてのファッション属性の中で、色は最も重要でありながら検出が難しいものの1つです。既存のアプローチは分類ベースであるため、個別の事前定義された色名のリストを超えることはできません。この論文では、正確なRGB値を予測するための回帰問題として色検出を扱います。そのため、最初の色分類子に加えて、新しく提案されたアーキテクチャに改良のための2番目の回帰ステージを含めます。この2番目のステップは、2つの注意モデルを組み合わせたものです。1つ目は衣服のタイプに依存し、2つ目は分類器によって以前に検出された色に依存します。最終的な予測は、照明が補正された、画像ピクセルのRGB値に対する重み付けされた空間プーリングです。このアーキテクチャはモジュール式であり、多色の衣服のすべての色のRGBを検出するために簡単に拡張できます。実験では、アーキテクチャの各コンポーネントの利点を示します。
Developing deep networks that analyze fashion garments has many real-world applications. Among all fashion attributes, color is one of the most important yet challenging to detect. Existing approaches are classification-based and thus cannot go beyond the list of discrete predefined color names. In this paper, we handle color detection as a regression problem to predict the exact RGB values. That's why in addition to a first color classifier, we include a second regression stage for refinement in our newly proposed architecture. This second step combines two attention models: the first depends on the type of clothing, the second depends on the color previously detected by the classifier. Our final prediction is the weighted spatial pooling over the image pixels RGB values, where the illumination has been corrected. This architecture is modular and easily expanded to detect the RGBs of all colors in a multicolor garment. In our experiments, we show the benefits of each component of our architecture.