arXiv reaDer
計算イメージングにおけるディープオプティカルコーディングデザイン
Deep Optical Coding Design in Computational Imaging
計算光学イメージング(COI)システムは、セットアップで光学コーディング要素(CE)を活用して、単一または複数のスナップショットで高次元シーンをエンコードし、計算アルゴリズムを使用してデコードします。 COIシステムのパフォーマンスは、その主要コンポーネントの設計、つまりCEパターンと特定のタスクを実行するために使用される計算方法に大きく依存します。従来のアプローチは、CEの分布を設定するためにランダムパターンまたは分析設計に依存しています。ただし、ディープニューラルネットワーク(DNN)の利用可能なデータおよびアルゴリズム機能により、光学エンコーダーと計算デコーダーを共同で検討するCEデータ駆動型設計に新たな地平が開かれました。具体的には、物理ベースの光の伝播とCEとの相互作用を考慮した、完全に微分可能な画像形成モデルを介してCOI測定をモデル化することにより、CEと計算デコーダーを定義するパラメーターをエンドツーエンドで最適化できます。 (E2E)マナー。さらに、同じフレームワークでCEだけを最適化することにより、純粋な光学系から推論タスクを実行できます。この作業では、CEデータ駆動型設計の最近の進歩を調査し、さまざまな光学要素をパラメーター化してE2Eフレームワークに含める方法に関するガイドラインを提供します。 E2Eフレームワークは、損失関数とDNNを変更することでさまざまな推論アプリケーションを処理できるため、スペクトルイメージングの再構築などの低レベルのタスク、または最適なタスクベースの光学アーキテクチャを使用して強化されたプライバシー保護を備えたポーズ推定などの高レベルのタスクを提示します。 。最後に、全光学DNNを使用して光速で実行される分類および3Dオブジェクト認識アプリケーションについて説明します。
Computational optical imaging (COI) systems leverage optical coding elements (CE) in their setups to encode a high-dimensional scene in a single or multiple snapshots and decode it by using computational algorithms. The performance of COI systems highly depends on the design of its main components: the CE pattern and the computational method used to perform a given task. Conventional approaches rely on random patterns or analytical designs to set the distribution of the CE. However, the available data and algorithm capabilities of deep neural networks (DNNs) have opened a new horizon in CE data-driven designs that jointly consider the optical encoder and computational decoder. Specifically, by modeling the COI measurements through a fully differentiable image formation model that considers the physics-based propagation of light and its interaction with the CEs, the parameters that define the CE and the computational decoder can be optimized in an end-to-end (E2E) manner. Moreover, by optimizing just CEs in the same framework, inference tasks can be performed from pure optics. This work surveys the recent advances on CE data-driven design and provides guidelines on how to parametrize different optical elements to include them in the E2E framework. Since the E2E framework can handle different inference applications by changing the loss function and the DNN, we present low-level tasks such as spectral imaging reconstruction or high-level tasks such as pose estimation with privacy preserving enhanced by using optimal task-based optical architectures. Finally, we illustrate classification and 3D object recognition applications performed at the speed of the light using all-optics DNN.
updated: Wed Aug 17 2022 14:48:39 GMT+0000 (UTC)
published: Mon Jun 27 2022 04:41:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト