arXiv reaDer
対照学習と疑似ラベルを使用して、小売製品の画像分類の表現を学習する
Using Contrastive Learning and Pseudolabels to learn representations for Retail Product Image Classification
小売製品の画像分類の問題は、多くの場合、ショット分類の問題ではありません。小売製品のクラスでは、猫、犬、樹木など、画像間で変化するタイプのバリエーションを持つことはできません。以前の研究では、畳み込みニューラルネットワークを微調整してそのようなデータセットの分類精度を向上させるさまざまな方法が示されています。この作業では、問題ステートメントに対処しようとします。小売製品の画像に十分な表現を生成する畳み込みニューラルネットワークバックボーンを事前トレーニングして、これらの表現で単純なロジスティック回帰をトレーニングすると、適切な分類子が得られるでしょうか。対照学習と疑似ラベルベースのノイズの多い学生トレーニングを使用して、小売製品の画像分類のためにConvnetバックボーン全体を微調整する順序で正確な表現を学習します。
Retail product Image classification problems are often few shot classification problems, given retail product classes cannot have the type of variations across images like a cat or dog or tree could have. Previous works have shown different methods to finetune Convolutional Neural Networks to achieve better classification accuracy on such datasets. In this work, we try to address the problem statement : Can we pretrain a Convolutional Neural Network backbone which yields good enough representations for retail product images, so that training a simple logistic regression on these representations gives us good classifiers ? We use contrastive learning and pseudolabel based noisy student training to learn representations that get accuracy in order of finetuning the entire Convnet backbone for retail product image classification.
updated: Thu Oct 07 2021 17:29:05 GMT+0000 (UTC)
published: Thu Oct 07 2021 17:29:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト