arXiv reaDer
CORE: 画像順序推定のための一貫した順序表現の学習
CORE: Learning Consistent Ordinal REpresentations for Image Ordinal Estimation
イメージ順序推定の目的は、畳み込みニューラル ネットワークを使用して、特定のイメージの順序ラベルを推定することです。既存の方法は主に順序回帰に基づいており、特に、入力の特徴表現から順序ラベル空間への順序マッピングのモデル化に重点を置いています。ただし、結果として得られる特徴表現の多様体は、関心のある固有の順序関係を維持しないため、画像の順序推定の有効性が妨げられます。したがって、この論文では、特徴表現が序数の低次元多様体を具現化することを奨励しながら、グラウンドトゥルース ラベルに存在する順序関係から固有の一貫した順序表現 (CORE) を学習することを提案します。最初に、順序全順序集合 (toset) 分布 (OTD) を開発します。これは、(i) ラベル埋め込みをモデル化して順序情報を継承し、近傍のサンプルの順序付きラベル間の距離を測定し、(ii) 特徴埋め込みをモデル化します。異なるサンプルの特徴の間で未知の順序情報を使用して数値の大きさを推測します。次に、OTD を使用して、特徴表現とラベルを同じ埋め込み空間に変換して位置合わせを改善し、順序ラベルと特徴表現の間のカルバック ライブラー (KL) ダイバージェンスを計算して、潜在空間に一貫した順序関係を与えます。 3 番目に、二重分解を使用した序数プロトタイプ制約付き凸計画法によって KL 発散を最適化します。私たちの理論的分析は、勾配逆伝播によって最適解を得ることができることを示しています。広範な実験結果は、提案された CORE が順序潜在空間を正確に構築し、既存の深い順序回帰法を大幅に強化してより良い結果を達成できることを示しています。
The goal of image ordinal estimation is to estimate the ordinal label of a given image with a convolutional neural network. Existing methods are mainly based on ordinal regression and particularly focus on modeling the ordinal mapping from the feature representation of the input to the ordinal label space. However, the manifold of the resultant feature representations does not maintain the intrinsic ordinal relations of interest, which hinders the effectiveness of the image ordinal estimation. Therefore, this paper proposes learning intrinsic Consistent Ordinal REpresentations (CORE) from ordinal relations residing in groundtruth labels while encouraging the feature representations to embody the ordinal low-dimensional manifold. First, we develop an ordinal totally ordered set (toset) distribution (OTD), which can (i) model the label embeddings to inherit ordinal information and measure distances between ordered labels of samples in a neighborhood, and (ii) model the feature embeddings to infer numerical magnitude with unknown ordinal information among the features of different samples. Second, through OTD, we convert the feature representations and labels into the same embedding space for better alignment, and then compute the Kullback Leibler (KL) divergence between the ordinal labels and feature representations to endow the latent space with consistent ordinal relations. Third, we optimize the KL divergence through ordinal prototype-constrained convex programming with dual decomposition; our theoretical analysis shows that we can obtain the optimal solutions via gradient backpropagation. Extensive experimental results demonstrate that the proposed CORE can accurately construct an ordinal latent space and significantly enhance existing deep ordinal regression methods to achieve better results.
updated: Sun Jan 15 2023 15:42:26 GMT+0000 (UTC)
published: Sun Jan 15 2023 15:42:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト