arXiv reaDer
効率的なビデオ オブジェクト セグメンテーションのための改善されたメモリ カバレッジによる時空ネットワークの再考
Rethinking Space-Time Networks with Improved Memory Coverage for Efficient Video Object Segmentation
このペーパーでは、ビデオ オブジェクト セグメンテーションのコンテキストで時空対応をモデル化するためのシンプルで効果的なアプローチを紹介します。ほとんどの既存のアプローチとは異なり、すべてのオブジェクトのマスク機能を再エンコードせずにフレーム間で直接対応を確立し、非常に効率的で堅牢なフレームワークを実現します。対応関係により、現在のクエリ フレーム内のすべてのノードは、過去の特徴を連想的に集約することによって推測されます。集計プロセスを投票の問題としてキャストしたところ、クエリに関係なく、既存の内積アフィニティにより、メモリの使用率が低下し、メモリ ノードの小さな (固定) サブセットが投票を支配することがわかりました。この現象に照らして、親和性を計算する代わりに、負のユークリッド距離の二乗を使用することを提案します。すべてのメモリ ノードが貢献するチャンスがあることを検証し、そのような多様な投票がメモリ効率と推論精度の両方に有益であることを実験的に示しました。通信ネットワークと多様な投票の相乗効果は非常にうまく機能し、DAVIS と YouTubeVOS の両方のデータセットで新しい最先端の結果を達成しながら、余計なものを使わずに複数のオブジェクトを 20+ FPS で大幅に高速化します。
This paper presents a simple yet effective approach to modeling space-time correspondences in the context of video object segmentation. Unlike most existing approaches, we establish correspondences directly between frames without re-encoding the mask features for every object, leading to a highly efficient and robust framework. With the correspondences, every node in the current query frame is inferred by aggregating features from the past in an associative fashion. We cast the aggregation process as a voting problem and find that the existing inner-product affinity leads to poor use of memory with a small (fixed) subset of memory nodes dominating the votes, regardless of the query. In light of this phenomenon, we propose using the negative squared Euclidean distance instead to compute the affinities. We validated that every memory node now has a chance to contribute, and experimentally showed that such diversified voting is beneficial to both memory efficiency and inference accuracy. The synergy of correspondence networks and diversified voting works exceedingly well, achieves new state-of-the-art results on both DAVIS and YouTubeVOS datasets while running significantly faster at 20+ FPS for multiple objects without bells and whistles.
updated: Fri Oct 08 2021 03:51:52 GMT+0000 (UTC)
published: Wed Jun 09 2021 16:50:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト