arXiv reaDer
半構造化データセット表現によるラベルフリーモデル評価
Label-Free Model Evaluation with Semi-Structured Dataset Representations
ラベルのないモデル評価(AutoEval)は、ラベルのないテストセットのモデルの精度を推定し、さまざまな見えない環境でのモデルの動作を理解するために重要です。データセット表現に基づいて画像ラベルがない場合、回帰を使用してAutoEvalのモデルパフォーマンスを推定します。一方では、画像機能はそのような表現の簡単な選択ですが、構造化されておらず(つまり、特定の場所のコンポーネントに特定の意味がない)、大規模であるため、回帰学習を妨げます。一方、以前の方法では、単純な構造化表現(平均信頼度や平均特徴など)を採用していますが、次元が限られているため、データ特性をキャプチャするには不十分です。この作業では、両方の長所を活用し、AutoEvalの豊富な情報を含みながら、回帰学習で管理可能な新しい半構造化データセット表現を提案します。画像の特徴に基づいて、分布の形、クラスター、および半構造化されたデータセット表現の代表的なサンプルを統合します。分布の形を使用した構造化された全体的な説明に加えて、クラスターと代表的なサンプルを使用した非構造化の説明には、AutoEvalタスクを容易にする追加の詳細な情報が含まれています。 3つの既存のデータセットと25の新しく導入されたデータセットについて、提案された表現が競争力のある結果を達成することを実験的に示します。コードとデータセットはhttps://github.com/sxzrt/Semi-Structured-Dataset-Representationsで入手できます。
Label-free model evaluation, or AutoEval, estimates model accuracy on unlabeled test sets, and is critical for understanding model behaviors in various unseen environments. In the absence of image labels, based on dataset representations, we estimate model performance for AutoEval with regression. On the one hand, image feature is a straightforward choice for such representations, but it hampers regression learning due to being unstructured (i.e. no specific meanings for component at certain location) and of large-scale. On the other hand, previous methods adopt simple structured representations (like average confidence or average feature), but insufficient to capture the data characteristics given their limited dimensions. In this work, we take the best of both worlds and propose a new semi-structured dataset representation that is manageable for regression learning while containing rich information for AutoEval. Based on image features, we integrate distribution shapes, clusters, and representative samples for a semi-structured dataset representation. Besides the structured overall description with distribution shapes, the unstructured description with clusters and representative samples include additional fine-grained information facilitating the AutoEval task. On three existing datasets and 25 newly introduced ones, we experimentally show that the proposed representation achieves competitive results. Code and dataset are available at https://github.com/sxzrt/Semi-Structured-Dataset-Representations.
updated: Wed Dec 01 2021 18:15:58 GMT+0000 (UTC)
published: Wed Dec 01 2021 18:15:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト