arXiv reaDer
数ショットの部分的なマルチビュー学習
Few-shot Partial Multi-view Learning
実際のアプリケーションでは、データが複数のビューを持つ場合がよくあります。各ビューの情報を完全に調査することは、データをより代表的なものにするために重要です。ただし、実際のデータは、データ収集と前処理のさまざまな失敗により、任意のビューの欠落に悩まされる傾向があります。さらに、大規模なラベル付きデータを取得するのは手間と費用がかかるため、ターゲットタスクで収集されたトレーニングサンプルも不足する可能性があります。これらの2つの問題が共存すると、パターン分類タスクを実行することがより困難になります。現在、私たちの知る限り、これら2つの問題を同時にうまく処理できる適切な方法はほとんどありません。コミュニティからこの課題にさらに注目を集めるために、このペーパーでは、低データ領域でのビューの欠落の影響を軽減することを目的とした、Few-shot Partial Multi-view Learning(FPML)と呼ばれる新しいタスクを紹介します。このタスクの課題は2つあります。(1)欠落しているビューの干渉の下で、データの不足によってもたらされる悪影響を克服することは困難です。 (2)限られた数のデータは情報不足を悪化させ、それによってビューの欠落の問題に対処することを困難にします。この論文では、このタスクのための統一ガウス密アンカー(UGD)と呼ばれる新しい方法を提案します。トレーニングサンプルごとに、統一された高密度ガウスアンカーを学習することを提案します。したがって、不完全なマルチビューデータを統一された表現空間に密に固定することができます。この場合、データの不足とビューの欠落の両方が、統一された密なアンカー表現によって軽減されます。特に、FPMLをマルチモーダルおよびクロスドメインシナリオに拡張し、それらでUGDメソッドを検証します。広範な実験は、私たちのアプローチの有効性をしっかりと示しています。
It is often the case that data are with multiple views in real-world applications. Fully exploring the information of each view is significant for making data more representative. However, real data tend to suffer from arbitrary view-missing due to various failures in data collection and pre-processing. Besides, as obtaining large-scale labeled data is laborious and expensive, the collected training samples in the target task may be scarce as well. The co-existence of these two problems makes it more challenging to achieve the pattern classification task. Currently, to our best knowledge, few appropriate methods can well-handle these two problems simultaneously. To draw more attention from the community to this challenge, we present a new task in this paper called Few-shot Partial Multi-view Learning (FPML), aiming to alleviate the view-missing effects in the low-data regime. The challenges of this task are twofold: (1) under the interference of the missing views, it is difficult to overcome the negative impact brought by data scarcity; (2) the limited number of data exacerbates information scarcity, thereby making it harder to address the view-missing problem. In this paper, we propose a novel method called Unified Gaussian Dense-anchoring (UGD) for this task. We propose to learn the unified dense Gaussian anchors for each training sample. Therefore, the incomplete multi-view data can be densely anchored into a unified representation space, where data scarcity and view missing are both relieved by the unified dense anchor representations. In particular, we also extend our FPML to the multimodal and the cross-domain scenario, and validate our UGD method on them. The extensive experiments firmly demonstrate the effectiveness of our approach.
updated: Thu Mar 03 2022 08:46:44 GMT+0000 (UTC)
published: Wed May 05 2021 13:34:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト