re-OBJ: Jointly Learning the Foreground and Background for Object Instance Re-identification
  オブジェクトインスタンスの再識別に対する従来のアプローチは、一連のフレーム間でのターゲットオブジェクトの外観の一致に依存しています。ただし、外観が似ている複数のオブジェクトや、同じオブジェクトクラスの複数のインスタンスがシーンに存在する場合、オブジェクトの外観のみの学習は失敗する場合があります。この論文では、背景の部分的な観察を利用して、硬いシーン、特にオブジェクトの同じモデルが繰り返し多く発生する硬い環境でのオブジェクト再識別タスクを支援できることを提案します。 Mask R-CNNアーキテクチャの拡張機能を使用して、オブジェクトが静的でカメラがシーン内を移動する屋内環境などの硬い実世界のシナリオに関連する前景と一緒に、背景の重要かつ明確な情報をエンコードする方法を学習します。 ScanNetデータセット内のオブジェクトの再識別における共同視覚機能の有効性を実証し、deepSortメソッドよりもランク1の精度で約28.25%の相対的な改善を示しています。
Conventional approaches to object instance re-identification rely on matching appearances of the target objects among a set of frames. However, learning appearances of the objects alone might fail when there are multiple objects with similar appearance or multiple instances of same object class present in the scene. This paper proposes that partial observations of the background can be utilized to aid in the object re-identification task for a rigid scene, especially a rigid environment with a lot of reoccurring identical models of objects. Using an extension to the Mask R-CNN architecture, we learn to encode the important and distinct information in the background jointly with the foreground relevant to rigid real-world scenarios such as an indoor environment where objects are static and the camera moves around the scene. We demonstrate the effectiveness of our joint visual feature in the re-identification of objects in the ScanNet dataset and show a relative improvement of around 28.25% in the rank-1 accuracy over the deepSort method.
updated: Mon Sep 23 2019 17:21:55 GMT+0000 (UTC)
published: Tue Sep 17 2019 10:36:12 GMT+0000 (UTC)
