オプティカルフローと画像の境界に基づいて、動画のオブジェクトセグメンテーションをオンラインで追跡するための軽量の変分フレームワークを提案します。このタスクのハイエンドコンピュータービジョンメソッドは、専用のCNNアーキテクチャのシーケンス固有のトレーニングに依存していますが、モーションとカラーからの一般的なビデオ情報に基づいて、変分モデルの可能性を示しています。このような手がかりは通常、ロボットのナビゲーションや把握の推定などのタスクに必要です。ビデオオブジェクトのセグメンテーションに直接利用するため、非常に低い追加コストで正確なセグメンテーションを実現できます。私たちの単純な方法は、パラメーター調整を伴う高価なCNNベースの方法と比較して競争力のある結果を提供できます。さらに、それぞれの結果を改善するために、私たちのアプローチを最先端のCNNベースのセグメンテーションと組み合わせることができることを示します。データセットDAVIS 16,17およびSegTrack v2でメソッドを評価します。
We propose a light-weight variational framework for online tracking of object segmentations in videos based on optical flow and image boundaries. While high-end computer vision methods on this task rely on sequence specific training of dedicated CNN architectures, we show the potential of a variational model, based on generic video information from motion and color. Such cues are usually required for tasks such as robot navigation or grasp estimation. We leverage them directly for video object segmentation and thus provide accurate segmentations at potentially very low extra cost. Our simple method can provide competitive results compared to the costly CNN-based methods with parameter tuning. Furthermore, we show that our approach can be combined with state-of-the-art CNN-based segmentations in order to improve over their respective results. We evaluate our method on the datasets DAVIS 16,17 and SegTrack v2.