arXiv reaDer
LighTN:点群ダウンサンプリングにおけるパフォーマンスとオーバーヘッドのトレードオフのための軽量Transformerネットワーク
LighTN: Light-weight Transformer Network for Performance-overhead Tradeoff in Point Cloud Downsampling
従来のタスクに関係のないダウンサンプリング方法と比較して、タスク指向のニューラルネットワークは点群のダウンサンプリング範囲でパフォーマンスが向上していることを示しています。最近、Transformerファミリーのネットワークは、視覚的なタスクでより強力な学習能力を示しています。ただし、Transformerベースのアーキテクチャは、多くのリソースを消費する可能性があり、通常、ダウンサンプリング範囲の低オーバーヘッドタスクネットワークには価値がありません。このホワイトペーパーでは、エンドツーエンドのプラグアンドプレイソリューションとして、タスク指向のポイントクラウドダウンサンプリング用の新しい軽量Transformerネットワーク(LighTN)を提案します。 LighTNでは、単一ヘッドの自己相関モジュールが提示され、洗練されたグローバルコンテキスト機能が抽出されます。ここで、3つの射影行列が同時に削除され、リソースオーバーヘッドが節約され、対称行列の出力が順列不変量を満たします。次に、新しいダウンサンプリング損失関数を設計して、LighTNがより均一な分布と顕著なポイントカバレッジを備えたクリティカルポイントクラウド領域に焦点を合わせるようにガイドします。さらに、フィードフォワードネットワークスケーリングメカニズムを導入して、expand-reduce戦略に従ってLighTNの学習可能な容量を強化します。分類および登録タスクに関する広範な実験の結果は、LighTNが限られたリソースオーバーヘッドで最先端のパフォーマンスを達成できることを示しています。
Compared with traditional task-irrelevant downsampling methods, task-oriented neural networks have shown improved performance in point cloud downsampling range. Recently, Transformer family of networks has shown a more powerful learning capacity in visual tasks. However, Transformer-based architectures potentially consume too many resources which are usually worthless for low overhead task networks in downsampling range. This paper proposes a novel light-weight Transformer network (LighTN) for task-oriented point cloud downsampling, as an end-to-end and plug-and-play solution. In LighTN, a single-head self-correlation module is presented to extract refined global contextual features, where three projection matrices are simultaneously eliminated to save resource overhead, and the output of symmetric matrix satisfies the permutation invariant. Then, we design a novel downsampling loss function to guide LighTN focuses on critical point cloud regions with more uniform distribution and prominent points coverage. Furthermore, We introduce a feed-forward network scaling mechanism to enhance the learnable capacity of LighTN according to the expand-reduce strategy. The result of extensive experiments on classification and registration tasks demonstrates LighTN can achieve state-of-the-art performance with limited resource overhead.
updated: Sun Feb 13 2022 08:55:53 GMT+0000 (UTC)
published: Sun Feb 13 2022 08:55:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト