arXiv reaDer
フレームからフレームへの畳み込みアクティベーションの再利用によるトレーニングと推論の高速化
Reusing Convolutional Activations from Frame to Frame to Speed up Training and Inference
  同様のフレームを連続して処理する場合、畳み込み演算の局所性を利用して、前のフレームから変更された画像の部分のみを再評価できます。畳み込み層の出力を保存し、フレームからフレームへの変更を計算することにより、以前のアクティベーションを再利用し、さもなければ無駄になっていた計算リソースを節約できます。この手法は、据え置き型ビデオカメラからのビデオの処理、画像のセクションのオクルージョンまたはディストーションの効果の研究、オーディオまたは時系列データの複数フレームへの畳み込みの適用、Atariゲームのプレイなど、多くのドメインに適用できます。さらに、この手法は、トレーニングと推論の両方を高速化するために適用できます。
When processing similar frames in succession, we can take advantage of the locality of the convolution operation to reevaluate only portions of the image that changed from the previous frame. By saving the output of a layer of convolutions and calculating the change from frame to frame, we can reuse previous activations and save computational resources that would otherwise be wasted recalculating convolutions whose outputs we have already observed. This technique can be applied to many domains, such as processing videos from stationary video cameras, studying the effects of occluding or distorting sections of images, applying convolution to multiple frames of audio or time series data, or playing Atari games. Furthermore, this technique can be applied to speed up both training and inference.
updated: Sun Sep 15 2019 05:59:09 GMT+0000 (UTC)
published: Mon Sep 02 2019 00:21:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト