arXiv reaDer
オープンな語彙学習に向けて: アンケート
Towards Open Vocabulary Learning: A Survey
視覚的なシーンの理解の分野では、ディープ ニューラル ネットワークは、セグメンテーション、追跡、検出などのさまざまなコア タスクにおいて目覚ましい進歩を遂げました。ただし、ほとんどのアプローチは近似セットの仮定に基づいて動作します。つまり、モデルはトレーニング セット内に存在する事前定義されたカテゴリのみを識別できます。最近、視覚言語の事前訓練の急速な進歩により、オープンな語彙設定が提案されました。これらの新しいアプローチは、注釈付きのラベル空間を超えてカテゴリーを見つけて認識しようとします。オープンボキャブラリーのアプローチは、弱く監視されたゼロショット設定と比較して、より一般的で実用的かつ効果的です。この文書では、オープンボキャブラリー学習を徹底的にレビューし、この分野の最近の発展を要約および分析します。特に、ゼロショット学習、開集合認識、分布外検出などの関連概念と比較することから始めます。次に、ロングテール問題、フューショット、ゼロショットの設定など、セグメンテーションと検出の場合に密接に関連するいくつかのタスクを確認します。手法調査では、まず予備知識として、近接集合における検出とセグメンテーションの基礎知識を提示します。次に、オープンボキャブラリー学習が使用されるさまざまなシナリオを検討し、共通の設計要素と中心となるアイデアを特定します。次に、一般的に使用されているデータセットとベンチマークにおける最近の検出およびセグメンテーションのアプローチを比較します。最後に、今後の研究の方向性に関する洞察、問題点、および議論で終わります。私たちの知る限り、これはオープンボキャブラリー学習に関する最初の包括的な文献レビューです。 https://github.com/jianzongwu/Awesome-Open-Vocabulary で関連作品を追跡し続けています。
In the field of visual scene understanding, deep neural networks have made impressive advancements in various core tasks like segmentation, tracking, and detection. However, most approaches operate on the close-set assumption, meaning that the model can only identify pre-defined categories that are present in the training set. Recently, open vocabulary settings were proposed due to the rapid progress of vision language pre-training. These new approaches seek to locate and recognize categories beyond the annotated label space. The open vocabulary approach is more general, practical, and effective compared to weakly supervised and zero-shot settings. This paper provides a thorough review of open vocabulary learning, summarizing and analyzing recent developments in the field. In particular, we begin by comparing it to related concepts such as zero-shot learning, open-set recognition, and out-of-distribution detection. Then, we review several closely related tasks in the case of segmentation and detection, including long-tail problems, few-shot, and zero-shot settings. For the method survey, we first present the basic knowledge of detection and segmentation in close-set as the preliminary knowledge. Next, we examine various scenarios in which open vocabulary learning is used, identifying common design elements and core ideas. Then, we compare the recent detection and segmentation approaches in commonly used datasets and benchmarks. Finally, we conclude with insights, issues, and discussions regarding future research directions. To our knowledge, this is the first comprehensive literature review of open vocabulary learning. We keep tracing related works at https://github.com/jianzongwu/Awesome-Open-Vocabulary.
updated: Wed Jun 28 2023 02:33:06 GMT+0000 (UTC)
published: Wed Jun 28 2023 02:33:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト