arXiv reaDer
回折型ニューラル ネットワークを使用したタイムラプス画像分類
Time-lapse image classification using a diffractive neural network
回折ディープ ニューラル ネットワーク (D2NN) は、伝播光の振幅および/または位相を変調することによって光入力情報を集合的に処理する、空間的に設計されたパッシブ サーフェスで構成される全光コンピューティング フレームワークを定義します。回折光ネットワークは、光学系の大規模な並列性を利用しながら、外部の計算能力を必要とせずに、薄い回折ボリュームを通る光の伝播速度で計算タスクを完了します。回折ネットワークは、オブジェクトの全光学分類を達成し、普遍的な線形変換を実行することが実証されました。ここでは、回折ネットワークを使用した「タイムラプス」画像分類スキームを初めて実証し、入力オブジェクトおよび/または回折ネットワークの横方向の動きを使用して、複雑な入力オブジェクトの分類精度と一般化パフォーマンスを大幅に向上させました。 、互いに相対的です。別の文脈では、オブジェクトおよび/またはカメラのそのような相対的な動きは、画像の超解像アプリケーションに日常的に使用されています。彼らの成功に触発されて、制御された、またはランダムな横方向のシフトによって作成された補完的な情報コンテンツから利益を得るために、タイムラプス回折ネットワークを設計しました。タイムラプス回折ネットワークの設計空間と性能限界を数値的に調査し、CIFAR-10 データセットからのオブジェクトの光学分類で 62.03% のブラインド テスト精度を明らかにしました。これは、CIFAR-10 データセットで単一の回折ネットワークを使用してこれまでに達成された最高の推論精度を構成します。タイムラプス回折ネットワークは、全光学プロセッサを使用した入力信号の時空間分析に広く役立ちます。
Diffractive deep neural networks (D2NNs) define an all-optical computing framework comprised of spatially engineered passive surfaces that collectively process optical input information by modulating the amplitude and/or the phase of the propagating light. Diffractive optical networks complete their computational tasks at the speed of light propagation through a thin diffractive volume, without any external computing power while exploiting the massive parallelism of optics. Diffractive networks were demonstrated to achieve all-optical classification of objects and perform universal linear transformations. Here we demonstrate, for the first time, a "time-lapse" image classification scheme using a diffractive network, significantly advancing its classification accuracy and generalization performance on complex input objects by using the lateral movements of the input objects and/or the diffractive network, relative to each other. In a different context, such relative movements of the objects and/or the camera are routinely being used for image super-resolution applications; inspired by their success, we designed a time-lapse diffractive network to benefit from the complementary information content created by controlled or random lateral shifts. We numerically explored the design space and performance limits of time-lapse diffractive networks, revealing a blind testing accuracy of 62.03% on the optical classification of objects from the CIFAR-10 dataset. This constitutes the highest inference accuracy achieved so far using a single diffractive network on the CIFAR-10 dataset. Time-lapse diffractive networks will be broadly useful for the spatio-temporal analysis of input signals using all-optical processors.
updated: Tue Aug 23 2022 08:16:30 GMT+0000 (UTC)
published: Tue Aug 23 2022 08:16:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト