arXiv reaDer
DDCNet:高密度予測のための深く拡張された畳み込みニューラルネットワーク
DDCNet: Deep Dilated Convolutional Neural Network for Dense Prediction
オプティカルフローや視差推定などの高密度ピクセルマッチングの問題は、コンピュータービジョンで最も困難なタスクの1つです。最近、これらの問題のために設計されたいくつかの深層学習方法が成功しています。十分に大きな有効受容野(ERF)とネットワーク内の空間的特徴のより高い解像度は、より高い解像度の高密度推定を提供するために不可欠です。この作業では、より高い空間的特徴の解像度を維持しながら、より大きな受容野を提供できるネットワークアーキテクチャを設計するための体系的なアプローチを提示します。より大きなERFを実現するために、拡張畳み込み層を利用しました。より深い層で拡張率を積極的に増加させることにより、トレーニング可能なパラメータの数を大幅に減らして、十分に大きなERFを実現することができました。ネットワーク設計戦略を説明するための主要なベンチマークとして、オプティカルフロー推定問題を使用しました。ベンチマーク結果(Sintel、KITTI、およびMiddlebury)は、当社のコンパクトネットワークが軽量ネットワークのクラスで同等のパフォーマンスを達成できることを示しています。
Dense pixel matching problems such as optical flow and disparity estimation are among the most challenging tasks in computer vision. Recently, several deep learning methods designed for these problems have been successful. A sufficiently larger effective receptive field (ERF) and a higher resolution of spatial features within a network are essential for providing higher-resolution dense estimates. In this work, we present a systemic approach to design network architectures that can provide a larger receptive field while maintaining a higher spatial feature resolution. To achieve a larger ERF, we utilized dilated convolutional layers. By aggressively increasing dilation rates in the deeper layers, we were able to achieve a sufficiently larger ERF with a significantly fewer number of trainable parameters. We used optical flow estimation problem as the primary benchmark to illustrate our network design strategy. The benchmark results (Sintel, KITTI, and Middlebury) indicate that our compact networks can achieve comparable performance in the class of lightweight networks.
updated: Fri Jul 09 2021 23:15:34 GMT+0000 (UTC)
published: Fri Jul 09 2021 23:15:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト