arXiv reaDer
レイヴン漸進行列を解くための形態学的混合によるデータ拡張
Data augmentation by morphological mixup for solving Raven's Progressive Matrices
レイヴンのプログレッシブ行列(RPM)は、人間の視覚的推論能力のテストに頻繁に使用されます。 RPMのようなデータセットとソリューションモデルの最近の進歩は、RPMの質問を視覚的に理解し、欠落している回答を論理的に推論するという課題に部分的に対処しています。 RPMデータセットのサンプルが不十分なために一般化のパフォーマンスが低いことを考慮して、効果的なスキーム、つまり候補回答形態混合(CAM-Mix)を提案します。 CAM-Mixは、グレースケール画像の形態学的混合によるデータ拡張戦略として機能します。これにより、さまざまな解決方法が正規化され、モデルの過剰適合の問題が克服されます。正解と意味的に類似した新しい否定的な候補の回答を作成することにより、より正確な決定境界を定義できます。提案されたデータ拡張方法を適用することにより、最先端のモデルと比較して、さまざまなRPMのようなデータセットで大幅かつ一貫したパフォーマンスの向上が達成されます。
Raven's Progressive Matrices (RPMs) are frequently used in testing human's visual reasoning ability. Recent advances of RPM-like datasets and solution models partially address the challenges of visually understanding the RPM questions and logically reasoning the missing answers. In view of the poor generalization performance due to insufficient samples in RPM datasets, we propose an effective scheme, namely Candidate Answer Morphological Mixup (CAM-Mix). CAM-Mix serves as a data augmentation strategy by gray-scale image morphological mixup, which regularizes various solution methods and overcomes the model overfitting problem. By creating new negative candidate answers semantically similar to the correct answers, a more accurate decision boundary could be defined. By applying the proposed data augmentation method, a significant and consistent performance improvement is achieved on various RPM-like datasets compared with the state-of-the-art models.
updated: Fri Nov 19 2021 07:37:38 GMT+0000 (UTC)
published: Tue Mar 09 2021 04:50:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト