Dont Even Look Once: Synthesizing Features for Zero-Shot Detection
 グラウンドトゥルースバウンディングボックスを使用して十分な注釈付きデータを収集することは単にスケーラブルではないため、ゼロショット検出、つまり表示オブジェクトと非表示オブジェクトの両方のローカライズは、多数のオブジェクトクラスを持つ大規模アプリケーションでますます重要になります。バニラディープニューラルネットワークは、トレーニング中に利用可能なオブジェクトに対して高いパフォーマンスを提供しますが、見えないオブジェクトの検出は大幅に低下します。基本的なレベルでは、バニラ検出器は目に見えないオブジェクトを含む境界ボックスを提案できますが、背景オブジェクトを拒否する必要がある固有の精度/リコールのトレードオフのために、目に見えないオブジェクトに高い信頼度を割り当てることができないことがよくあります。目に見えないオブジェクトの視覚的特徴を合成し、目に見えないオブジェクトの検出を組み込む既存のトレーニングアルゴリズムを強化する、新しい検出アルゴリズムDont Even Look Once(DELO)を提案します。提案されたスキームはPascal VOCおよびMSCOCOで評価され、バニラおよびその他の最先端のゼロショット検出器よりもテスト精度が大幅に改善されていることが実証されています。
Zero-shot detection, namely, localizing both seen and unseen objects, increasingly gains importance for large-scale applications, with large number of object classes, since, collecting sufficient annotated data with ground truth bounding boxes is simply not scalable. While vanilla deep neural networks deliver high performance for objects available during training, unseen object detection degrades significantly. At a fundamental level, while vanilla detectors are capable of proposing bounding boxes, which include unseen objects, they are often incapable of assigning high-confidence to unseen objects, due to the inherent precision/recall tradeoffs that requires rejecting background objects. We propose a novel detection algorithm Dont Even Look Once (DELO), that synthesizes visual features for unseen objects and augments existing training algorithms to incorporate unseen object detection. Our proposed scheme is evaluated on Pascal VOC and MSCOCO, and we demonstrate significant improvements in test accuracy over vanilla and other state-of-art zero-shot detectors
updated: Fri Apr 10 2020 15:34:04 GMT+0000 (UTC)
published: Mon Nov 18 2019 20:38:04 GMT+0000 (UTC)
