arXiv reaDer
MDQE: 困難な動画でオクルージョンされたインスタンスをセグメント化するための識別クエリ埋め込みのマイニング
MDQE: Mining Discriminative Query Embeddings to Segment Occluded Instances on Challenging Videos
印象的な進歩が達成されましたが、クリップごとの入力を使用するビデオ インスタンス セグメンテーション (VIS) メソッドは、遮られたオブジェクトや混雑したシーンを含む困難なビデオでは失敗することがよくあります。これは主に、これらのメソッドのインスタンス クエリがインスタンスの差別的な埋め込みを適切にエンコードできず、クエリベースのセグメンターがこれらの「ハード」インスタンスを区別するのが難しくなるためです。これらの問題に対処するために、識別クエリ埋め込み (MDQE) をマイニングして、挑戦的なビデオでオクルージョンされたインスタンスをセグメント化することを提案します。最初に、空間的なコンテキスト情報とフレーム間のオブジェクトの動きを考慮して、オブジェクト クエリの位置埋め込みとコンテンツの特徴を初期化します。次に、各インスタンスを近くの非ターゲット インスタンスから遠ざけるために、インスタンス間のマスク反発損失を提案します。提案された MDQE は、挑戦的なビデオで最先端の結果を達成し、単純なビデオで競争力のあるパフォーマンスを達成する、クリップごとの入力を備えた最初の VIS メソッドです。具体的には、ResNet50 を使用した MDQE は、OVIS および YouTube-VIS 2021 でそれぞれ 33.0% および 44.5% のマスク AP を達成します。 MDQE のコードは、https://github.com/MinghanLi/MDQE_CVPR2023 にあります。
While impressive progress has been achieved, video instance segmentation (VIS) methods with per-clip input often fail on challenging videos with occluded objects and crowded scenes. This is mainly because instance queries in these methods cannot encode well the discriminative embeddings of instances, making the query-based segmenter difficult to distinguish those `hard' instances. To address these issues, we propose to mine discriminative query embeddings (MDQE) to segment occluded instances on challenging videos. First, we initialize the positional embeddings and content features of object queries by considering their spatial contextual information and the inter-frame object motion. Second, we propose an inter-instance mask repulsion loss to distance each instance from its nearby non-target instances. The proposed MDQE is the first VIS method with per-clip input that achieves state-of-the-art results on challenging videos and competitive performance on simple videos. In specific, MDQE with ResNet50 achieves 33.0% and 44.5% mask AP on OVIS and YouTube-VIS 2021, respectively. Code of MDQE can be found at https://github.com/MinghanLi/MDQE_CVPR2023.
updated: Sat Mar 25 2023 08:13:36 GMT+0000 (UTC)
published: Sat Mar 25 2023 08:13:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト