arXiv reaDer
新しいドメインのスケッチ認識機能のトレーニングについて
On Training Sketch Recognizers for New Domains
スケッチ認識アルゴリズムは、長年にわたってスケッチ認識コミュニティによって提供された公開されているデータセットを使用して設計および評価されています。既存のデータセットには限られた汎用オブジェクトのセットのスケッチが含まれていますが、新しいドメインごとに、ドメイン固有の認識機能をトレーニングするために新しいデータを収集する必要があります。これにより、2つの基本的な懸念が生じます。1つは、データ収集プロトコルが生態学的に有効なデータを生成するかどうかです。第二に、収集されたデータの量は、十分に正確な分類器をトレーニングするのに十分でしょうか?このホワイトペーパーでは、これら2つの懸念事項に注目します。データ収集プロトコルの生態学的妥当性と小さなデータセットに対応する能力が、現実的なシナリオでの認識器の精度に影響を与える重要な要因であることを示します。より具体的には、スケッチベースのゲームをユースケースとして使用して、ディープラーニング手法と従来の手法がデータセットのシフトに大きく影響されることを示します。さらに、データが不足していて高価な現実的なシナリオでは、ディープラーニングを小さなデータセットに適応させるために取られた標準的な対策は、他の方法と比べて遜色がないことを示しています。転送学習と広範なデータ拡張はディープラーニングに役立ちますが、標準のセットアップ(たとえば、標準の機能表現を備えたSVMやGBM)と比較してパフォーマンスが大幅に低下します。小さなデータセットからの学習を、既存の文献の大部分で無視されてきた深いスケッチ認識分野の重要な問題として提起します。
Sketch recognition algorithms are engineered and evaluated using publicly available datasets contributed by the sketch recognition community over the years. While existing datasets contain sketches of a limited set of generic objects, each new domain inevitably requires collecting new data for training domain specific recognizers. This gives rise to two fundamental concerns: First, will the data collection protocol yield ecologically valid data? Second, will the amount of collected data suffice to train sufficiently accurate classifiers? In this paper, we draw attention to these two concerns. We show that the ecological validity of the data collection protocol and the ability to accommodate small datasets are significant factors impacting recognizer accuracy in realistic scenarios. More specifically, using sketch-based gaming as a use case, we show that deep learning methods, as well as more traditional methods, suffer significantly from dataset shift. Furthermore, we demonstrate that in realistic scenarios where data is scarce and expensive, standard measures taken for adapting deep learners to small datasets fall short of comparing favorably with alternatives. Although transfer learning, and extensive data augmentation help deep learners, they still perform significantly worse compared to standard setups (e.g., SVMs and GBMs with standard feature representations). We pose learning from small datasets as a key problem for the deep sketch recognition field, one which has been ignored in the bulk of the existing literature.
updated: Sun Apr 18 2021 13:24:49 GMT+0000 (UTC)
published: Sun Apr 18 2021 13:24:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト