arXiv reaDer
PixelRNN: ニューラル センサーによるエンドツーエンド最適化知覚のためのピクセル内再帰型ニューラル ネットワーク
PixelRNN: In-pixel Recurrent Neural Networks for End-to-end-optimized Perception with Neural Sensors
従来のイメージ センサーは、高速フレーム レートで高解像度の画像をデジタル化し、さらなる処理のためにセンサーから送信する必要がある大量のデータを生成します。通信は電力効率が悪く、遅延が発生するため、これはエッジ デバイスで動作する認識システムにとっては困難です。スタック型イメージ センサーの製造における革新に後押しされて、新しいセンサー プロセッサは、センサー上で直接プログラム可能性と最小限の処理機能を提供します。純粋なバイナリ演算を使用してセンサーの時空間的特徴をエンコードする効率的なリカレント ニューラル ネットワーク アーキテクチャ PixelRNN を開発することで、これらの機能を活用します。 PixelRNN は、センサーから送信されるデータの量を従来のシステムと比較して 64 分の 1 に削減し、ハンド ジェスチャー認識と読唇タスクで競争力のある精度を提供します。 SCAMP-5センサープロセッサプラットフォームでのプロトタイプ実装を使用して、PixelRNNを実験的に検証します。
Conventional image sensors digitize high-resolution images at fast frame rates, producing a large amount of data that needs to be transmitted off the sensor for further processing. This is challenging for perception systems operating on edge devices, because communication is power inefficient and induces latency. Fueled by innovations in stacked image sensor fabrication, emerging sensor-processors offer programmability and minimal processing capabilities directly on the sensor. We exploit these capabilities by developing an efficient recurrent neural network architecture, PixelRNN, that encodes spatio-temporal features on the sensor using purely binary operations. PixelRNN reduces the amount of data to be transmitted off the sensor by a factor of 64x compared to conventional systems while offering competitive accuracy for hand gesture recognition and lip reading tasks. We experimentally validate PixelRNN using a prototype implementation on the SCAMP-5 sensor-processor platform.
updated: Tue Apr 11 2023 18:16:47 GMT+0000 (UTC)
published: Tue Apr 11 2023 18:16:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト