arXiv reaDer
リアルタイムビデオセグメンテーションのための歪みを意識したネットワークプルーニングと機能の再利用
Distortion-Aware Network Pruning and Feature Reuse for Real-time Video Segmentation
リアルタイムのビデオセグメンテーションは、自動運転やロボット制御などの多くの実際のアプリケーションにとって重要なタスクです。最先端のセマンティックセグメンテーションモデルは、その優れたパフォーマンスにもかかわらず、リアルタイムアプリケーションには重すぎることが多いため、研究者は、速度と精度のトレードオフを備えた軽量アーキテクチャを提案し、精度の低下を犠牲にしてリアルタイムの速度を実現しました。この論文では、ビデオの時間的局所性を活用することにより、リアルタイムビジョンタスクのスキップ接続を備えたアーキテクチャを高速化するための新しいフレームワークを提案します。具体的には、各フレームの到着時に、前のフレームの特徴を変換して、特定の空間ビンで再利用します。次に、現在のフレームと前のフレームの間の時間的差異をキャプチャする現在のフレームの領域でバックボーンネットワークの部分的な計算を実行します。これは、フレーム間の歪みに基づいてドロップするブロックを決定するゲーティングメカニズムを使用して、残りのブロックを動的にドロップアウトすることによって行われます。複数のバックボーンネットワークを使用したビデオセマンティックセグメンテーションベンチマークでSpatial-TemporalMaskGenerator(STMG)を検証し、この方法が精度の低下を最小限に抑えて推論を大幅に高速化することを示します。
Real-time video segmentation is a crucial task for many real-world applications such as autonomous driving and robot control. Since state-of-the-art semantic segmentation models are often too heavy for real-time applications despite their impressive performance, researchers have proposed lightweight architectures with speed-accuracy trade-offs, achieving real-time speed at the expense of reduced accuracy. In this paper, we propose a novel framework to speed up any architecture with skip-connections for real-time vision tasks by exploiting the temporal locality in videos. Specifically, at the arrival of each frame, we transform the features from the previous frame to reuse them at specific spatial bins. We then perform partial computation of the backbone network on the regions of the current frame that captures temporal differences between the current and previous frame. This is done by dynamically dropping out residual blocks using a gating mechanism which decides which blocks to drop based on inter-frame distortion. We validate our Spatial-Temporal Mask Generator (STMG) on video semantic segmentation benchmarks with multiple backbone networks, and show that our method largely speeds up inference with minimal loss of accuracy.
updated: Mon Jun 20 2022 07:20:02 GMT+0000 (UTC)
published: Mon Jun 20 2022 07:20:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト