arXiv reaDer
トランスフォーマーを使用した一般的なマルチラベル画像分類
General Multi-label Image Classification with Transformers
マルチラベル画像分類は、画像に存在するオブジェクト、属性、またはその他のエンティティに対応するラベルのセットを予測するタスクです。この作業では、分類トランスフォーマー(C-Tran)を提案します。これは、トランスフォーマーを活用して視覚的特徴とラベル間の複雑な依存関係を活用するマルチラベル画像分類の一般的なフレームワークです。私たちのアプローチは、マスクされたラベルの入力セットが与えられた場合にターゲットラベルのセットを予測するようにトレーニングされたTransformerエンコーダーと、畳み込みニューラルネットワークからの視覚的特徴で構成されます。私たちの方法の重要な要素は、トレーニング中にラベルの状態をポジティブ、ネガティブ、または不明として表すために3値エンコードスキームを使用するラベルマスクトレーニング目標です。私たちのモデルは、COCOやVisualGenomeなどの挑戦的なデータセットでの最先端のパフォーマンスを示しています。さらに、私たちのモデルはトレーニング中のラベルの不確実性を明示的に表すため、推論中に部分的または余分なラベル注釈が付いた画像の結果を改善できるようにすることで、より一般的になります。 COCO、Visual Genome、News500、およびCUB画像データセットでこの追加機能を示します。
Multi-label image classification is the task of predicting a set of labels corresponding to objects, attributes or other entities present in an image. In this work we propose the Classification Transformer (C-Tran), a general framework for multi-label image classification that leverages Transformers to exploit the complex dependencies among visual features and labels. Our approach consists of a Transformer encoder trained to predict a set of target labels given an input set of masked labels, and visual features from a convolutional neural network. A key ingredient of our method is a label mask training objective that uses a ternary encoding scheme to represent the state of the labels as positive, negative, or unknown during training. Our model shows state-of-the-art performance on challenging datasets such as COCO and Visual Genome. Moreover, because our model explicitly represents the uncertainty of labels during training, it is more general by allowing us to produce improved results for images with partial or extra label annotations during inference. We demonstrate this additional capability in the COCO, Visual Genome, News500, and CUB image datasets.
updated: Fri Nov 27 2020 23:20:35 GMT+0000 (UTC)
published: Fri Nov 27 2020 23:20:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト