画像順序回帰は、主にカテゴリの順序を利用する方向で研究されてきました。ただし、順序回帰で非常に一般的なクラスの不均衡とカテゴリの重複の問題は、ほとんど見落とされていました。その結果、マイノリティ カテゴリのパフォーマンスはしばしば満足のいくものではありません。この論文では、これら2つの問題に直接取り組むために、制御可能な画像生成に基づくCIGと呼ばれる新しいフレームワークを提案します。私たちの主なアイデアは、カテゴリ境界の近くに特定のラベルを持つ追加のトレーニング サンプルを生成することであり、サンプル生成はあまり代表されていないカテゴリに偏っています。制御可能な画像生成を実現するために、構造的類似性、カテゴリ的類似性、および再構成の制約に基づいて、画像の構造情報とカテゴリ情報を分離しようとします。 3 つの異なる画像序数回帰シナリオで、新しい CIG アプローチの有効性を評価します。結果は、CIG を既製の画像エンコーダーまたは順序回帰モデルと柔軟に統合して改善を達成できることを示しており、さらに、改善は少数派カテゴリでより重要です。
Image ordinal regression has been mainly studied along the line of exploiting the order of categories. However, the issues of class imbalance and category overlap that are very common in ordinal regression were largely overlooked. As a result, the performance on minority categories is often unsatisfactory. In this paper, we propose a novel framework called CIG based on controllable image generation to directly tackle these two issues. Our main idea is to generate extra training samples with specific labels near category boundaries, and the sample generation is biased toward the less-represented categories. To achieve controllable image generation, we seek to separate structural and categorical information of images based on structural similarity, categorical similarity, and reconstruction constraints. We evaluate the effectiveness of our new CIG approach in three different image ordinal regression scenarios. The results demonstrate that CIG can be flexibly integrated with off-the-shelf image encoders or ordinal regression models to achieve improvement, and further, the improvement is more significant for minority categories.