画像分類モデルは、多くの場合、トレーニング データ内の入力フィーチャと出力クラスの間の無関係な共起に基づいてクラスを予測することを学習します。望ましくない相関関係を「データ バイアス」と呼び、データ バイアスを引き起こす視覚的特徴を「バイアス要因」と呼びます。人間の介入なしにバイアスを自動的に特定して軽減することは困難です。そのため、人間参加型のソリューションを見つけるために設計調査を実施しました。まず、3 人の専門家と共に、画像分類モデルのバイアス軽減プロセスをキャプチャするユーザー タスクを特定しました。次に、タスクをサポートするために、ユーザーがバイアス要因を視覚的に特定し、最先端の画像から画像への変換モデルを使用して合成画像を繰り返し生成し、分類精度を向上させるためのモデル トレーニング プロセス。 10 名の参加者による定量的評価と定性的研究は、DASH の有用性を実証し、今後の作業に教訓を提供します。
Image classification models often learn to predict a class based on irrelevant co-occurrences between input features and an output class in training data. We call the unwanted correlations "data biases," and the visual features causing data biases "bias factors." It is challenging to identify and mitigate biases automatically without human intervention. Therefore, we conducted a design study to find a human-in-the-loop solution. First, we identified user tasks that capture the bias mitigation process for image classification models with three experts. Then, to support the tasks, we developed a visual analytics system called DASH that allows users to visually identify bias factors, to iteratively generate synthetic images using a state-of-the-art image-to-image translation model, and to supervise the model training process for improving the classification accuracy. Our quantitative evaluation and qualitative study with ten participants demonstrate the usefulness of DASH and provide lessons for future work.