オブジェクト検出は、コンピュータビジョンと画像処理の基本的なタスクです。現在の深層学習ベースのオブジェクト検出器は、豊富なラベル付きデータで非常に成功しています。ただし、実際には、各オブジェクトカテゴリにトレーニング用の十分なラベル付きサンプルがあるとは限りません。これらの大型物体検出器は、トレーニングデータが限られている場合に簡単に過剰適合します。したがって、オブジェクト検出に少数ショット学習とゼロショット学習を導入する必要があります。これらを合わせて、ローショットオブジェクト検出と呼ぶことができます。低ショットオブジェクト検出(LSOD)は、少数またはゼロのラベル付きデータからオブジェクトを検出することを目的としています。これらのデータは、それぞれ、少数ショットオブジェクト検出(FSOD)とゼロショットオブジェクト検出(ZSD)に分類できます。このホワイトペーパーでは、FSODとZSDに基づくディープラーニングの包括的な調査を実施します。まず、この調査では、FSODとZSDの方法をさまざまなカテゴリに分類し、それらの長所と短所について説明します。次に、この調査では、FSODとZSDのデータセット設定と評価指標を確認し、これらのベンチマークでさまざまな方法のパフォーマンスを分析します。最後に、この調査では、FSODとZSDの将来の課題と有望な方向性について説明します。
Object detection is a fundamental task in computer vision and image processing. Current deep learning based object detectors have been highly successful with abundant labeled data. But in real life, it is not guaranteed that each object category has enough labeled samples for training. These large object detectors are easy to overfit when the training data is limited. Therefore, it is necessary to introduce few-shot learning and zero-shot learning into object detection, which can be named low-shot object detection together. Low-Shot Object Detection (LSOD) aims to detect objects from a few or even zero labeled data, which can be categorized into few-shot object detection (FSOD) and zero-shot object detection (ZSD), respectively. This paper conducts a comprehensive survey for deep learning based FSOD and ZSD. First, this survey classifies methods for FSOD and ZSD into different categories and discusses the pros and cons of them. Second, this survey reviews dataset settings and evaluation metrics for FSOD and ZSD, then analyzes the performance of different methods on these benchmarks. Finally, this survey discusses future challenges and promising directions for FSOD and ZSD.