arXiv reaDer
スナップショット圧縮イメージングのためのシンプルで効率的な再構成バックボーン
A Simple and Efficient Reconstruction Backbone for Snapshot Compressive Imaging
スナップショット圧縮イメージング(SCI)の新しいテクノロジーにより、高次元(HD)データを効率的にキャプチャできます。これは通常、HD信号を2D測定に圧縮する光学式エンコーダとハードウェアでエンコードされた測定時にHDデータを取得するアルゴリズムデコーダの2つのコンポーネントによって実装されます。幅広いSCIアプリケーションで、ハイパースペクトルイメージング(HSI)とビデオ圧縮センシングが近年大きな研究の注目を集めています。既存のSCI再構築アルゴリズムの中で、深層学習ベースの方法は、有望なパフォーマンスと効率的な推論として際立っています。ただし、深層再構築ネットワークは、モデルサイズが大きすぎて高度に特殊化されたネットワーク設計に悩まされる可能性があり、必然的にトレーニング時間のコストが高くなり、メモリ使用量が多くなり、柔軟性が制限されるため、実際のシナリオでのSCIシステムの展開が妨げられます。本論文では、ネストされた構造と空間不変特性を用いた残余学習戦略を再検討することにより、シンプルでありながら非常に効率的な再構成法、すなわちスタック残余ネットワーク(SRN)を提案することによって上記の課題に取り組みます。提案されたSRNは、既存のネットワークと比較して、少ない計算操作と無視できるモデルサイズで高忠実度のデータ検索を可能にし、ハイパースペクトルデータとビデオデータの両方に適用できる多用途のバックボーンとしても機能します。提案されたバックボーンに基づいて、最初にチャネル注意強化SRN(CAE-SRN)を開発し、HSIでのきめ細かい空間推定のためのスペクトル相互依存性を調査します。次に、SRNをディープデノイザーとして採用し、それを一般化された交互投影(GAP)フレームワークに組み込んで(GAP-SRNになります)、ビデオ圧縮センシングタスクを処理します。実験結果は、2つのSCIアプリケーションで提案されたSRNの最先端のパフォーマンス、高い計算効率を示しています。
The emerging technology of snapshot compressive imaging (SCI) enables capturing high dimensional (HD) data in an efficient way. It is generally implemented by two components: an optical encoder that compresses HD signals into a 2D measurement and an algorithm decoder that retrieves the HD data upon the hardware-encoded measurement. Over a broad range of SCI applications, hyperspectral imaging (HSI) and video compressive sensing have received significant research attention in recent years. Among existing SCI reconstruction algorithms, deep learning-based methods stand out as their promising performance and efficient inference. However, the deep reconstruction network may suffer from overlarge model size and highly-specialized network design, which inevitably lead to costly training time, high memory usage, and limited flexibility, thus discouraging the deployments of SCI systems in practical scenarios. In this paper, we tackle the above challenges by proposing a simple yet highly efficient reconstruction method, namely stacked residual network (SRN), by revisiting the residual learning strategy with nested structures and spatial-invariant property. The proposed SRN empowers high-fidelity data retrieval with fewer computation operations and negligible model size compared with existing networks, and also serves as a versatile backbone applicable for both hyperspectral and video data. Based on the proposed backbone, we first develop the channel attention enhanced SRN (CAE-SRN) to explore the spectral inter-dependencies for fine-grained spatial estimation in HSI. We then employ SRN as a deep denoiser and incorporate it into a generalized alternating projection (GAP) framework -- resulting in GAP-SRN -- to handle the video compressive sensing task. Experimental results demonstrate the state-of-the-art performance, high computational efficiency of the proposed SRN on two SCI applications.
updated: Wed Feb 02 2022 01:34:30 GMT+0000 (UTC)
published: Tue Aug 17 2021 16:20:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト