arXiv reaDer
完全双曲線たたみ込みニューラルネットワーク
Fully Hyperbolic Convolutional Neural Networks
たたみ込みニューラルネットワーク(CNN)は最近、さまざまなコンピュータービジョンタスクで大きな成功を収めています。ただし、高解像度の画像やビデオのセグメンテーションや3D医用画像など、高次元の入出力に関する問題への適用は、さまざまな要因によって制限されてきました。主に、トレーニング段階では、バックプロパゲーションのためにネットワークアクティベーションを保存する必要があります。これらの設定では、アクティベーションの保存に関連するメモリ要件が、特に3Dの問題の場合、現在のハードウェアで実現可能な要件を超える可能性があります。双曲線テレグラフ方程式によって制御される物理ネットワークを介した信号の伝播を動機として、この作業では、高次元の入力と出力の問題に対して完全に保守的な双曲線ネットワークを導入します。学習可能な離散ウェーブレット変換とその逆を使用してネットワーク状態を粗くして補間し、チャネル数を変更することにより、完全に可逆的なCNNを可能にする粗くする操作を紹介します。完全にリバーシブルなネットワークは、4Dタイムラプスハイパースペクトル画像セグメンテーションおよびフル3Dビデオセグメンテーションの最先端技術に匹敵する結果を、ネットワーク深度に依存しない定数であるはるかに低いメモリフットプリントで実現できることを示しています。また、そのようなネットワークの使用を、高解像度の入力と出力を備えた変分自動エンコーダまで拡張します。
Convolutional Neural Networks (CNN) have recently seen tremendous success in various computer vision tasks. However, their application to problems with high dimensional input and output, such as high-resolution image and video segmentation or 3D medical imaging, has been limited by various factors. Primarily, in the training stage, it is necessary to store network activations for back propagation. In these settings, the memory requirements associated with storing activations can exceed what is feasible with current hardware, especially for problems in 3D. Motivated by the propagation of signals over physical networks, that are governed by the hyperbolic Telegraph equation, in this work we introduce a fully conservative hyperbolic network for problems with high dimensional input and output. We introduce a coarsening operation that allows completely reversible CNNs by using a learnable Discrete Wavelet Transform and its inverse to both coarsen and interpolate the network state and change the number of channels. We show that fully reversible networks are able to achieve results comparable to the state of the art in 4D time-lapse hyper spectral image segmentation and full 3D video segmentation, with a much lower memory footprint that is a constant independent of the network depth. We also extend the use of such networks to Variational Auto Encoders with high resolution input and output.
updated: Tue Jul 07 2020 18:02:05 GMT+0000 (UTC)
published: Fri May 24 2019 23:43:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト