人間の脳は入力の識別部分を強調し、無関係な部分を抑制できるという事実に触発され、コンピューター ビジョンの開発を促進するために実質的なローカル メカニズムが設計されてきました。ターゲット部分に焦点を当てて識別的な局所表現を学習するだけでなく、情報を選択的に処理して効率を向上させることもできます。アプリケーションのシナリオとパラダイムの観点から見ると、ローカル メカニズムにはさまざまな特性があります。この調査では、きめの細かい視覚認識、人の再識別、少数/ゼロショット学習、マルチモーダル学習、自己教師あり学習、ビジョントランスフォーマーなど。各分野における局所メカニズムの分類をまとめました。次に、すべてのカテゴリの長所と短所を深く分析し、探索の余地を残します。最後に、将来の研究に役立つ可能性のある局所メカニズムに関する将来の研究の方向性についても議論されました。私たちの知る限り、これはコンピュータ ビジョンに関するローカル メカニズムに関する最初の調査です。この調査が、コンピュータ ビジョン分野における将来の研究に光を当てることができることを願っています。
Inspired by the fact that human brains can emphasize discriminative parts of the input and suppress irrelevant ones, substantial local mechanisms have been designed to boost the development of computer vision. They can not only focus on target parts to learn discriminative local representations, but also process information selectively to improve the efficiency. In terms of application scenarios and paradigms, local mechanisms have different characteristics. In this survey, we provide a systematic review of local mechanisms for various computer vision tasks and approaches, including fine-grained visual recognition, person re-identification, few-/zero-shot learning, multi-modal learning, self-supervised learning, Vision Transformers, and so on. Categorization of local mechanisms in each field is summarized. Then, advantages and disadvantages for every category are analyzed deeply, leaving room for exploration. Finally, future research directions about local mechanisms have also been discussed that may benefit future works. To the best our knowledge, this is the first survey about local mechanisms on computer vision. We hope that this survey can shed light on future research in the computer vision field.