arXiv reaDer
コンピュータビジョンと深層学習におけるテンソル法
Tensor Methods in Computer Vision and Deep Learning
テンソル、または多次元配列は、多次元の視覚データを自然に表すことができるデータ構造です。本質的に構造化された潜在的な意味空間と高次の相互作用を効率的にキャプチャできるテンソルは、コンピュータビジョンの問題の広い範囲でのアプリケーションの長い歴史があります。コンピュータビジョンにおけるディープラーニングのパラダイムシフトの到来により、テンソルはさらに基本的なものになりました。実際、畳み込みや注意メカニズムなど、現代の深層学習アーキテクチャに不可欠な要素は、テンソルマッピングと容易に見なすことができます。事実上、テンソル法は、メモリの設計や効率的なネットワークアーキテクチャの計算、ランダムノイズや敵対的攻撃に対する堅牢性の向上、ディープネットワークの理論的理解の支援など、ディープラーニングで重要なアプリケーションをますます見つけています。この記事では、視覚データ分析とコンピュータービジョンアプリケーションに特に焦点を当てて、表現学習と深層学習のコンテキストでのテンソルとテンソル法の詳細で実用的なレビューを提供します。具体的には、テンソルベースの視覚データ分析手法の基本的な作業に加えて、特に深層学習アーキテクチャでテンソル手法の段階的な増加をもたらした最近の開発と、コンピュータービジョンアプリケーションにおけるそれらの影響に焦点を当てています。新規参入者がそのような概念をすばやく理解できるようにするために、TensorLyを使用して、ペーパーの重要な側面をカバーし、それらを段階的に実装する、コンパニオンPythonノートブックを提供します。
Tensors, or multidimensional arrays, are data structures that can naturally represent visual data of multiple dimensions. Inherently able to efficiently capture structured, latent semantic spaces and high-order interactions, tensors have a long history of applications in a wide span of computer vision problems. With the advent of the deep learning paradigm shift in computer vision, tensors have become even more fundamental. Indeed, essential ingredients in modern deep learning architectures, such as convolutions and attention mechanisms, can readily be considered as tensor mappings. In effect, tensor methods are increasingly finding significant applications in deep learning, including the design of memory and compute efficient network architectures, improving robustness to random noise and adversarial attacks, and aiding the theoretical understanding of deep networks. This article provides an in-depth and practical review of tensors and tensor methods in the context of representation learning and deep learning, with a particular focus on visual data analysis and computer vision applications. Concretely, besides fundamental work in tensor-based visual data analysis methods, we focus on recent developments that have brought on a gradual increase of tensor methods, especially in deep learning architectures, and their implications in computer vision applications. To further enable the newcomer to grasp such concepts quickly, we provide companion Python notebooks, covering key aspects of the paper and implementing them, step-by-step with TensorLy.
updated: Wed Jul 07 2021 18:42:45 GMT+0000 (UTC)
published: Wed Jul 07 2021 18:42:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト