鏡は私たちの日常生活のどこにでもあります。既存のコンピュータービジョンシステムはミラーを考慮しないため、ミラー内の反射コンテンツによって混乱し、パフォーマンスが大幅に低下する可能性があります。ただし、ミラーの外側の実際のコンテンツを、ミラーの内側の反射コンテンツから分離することは簡単ではありません。主な課題は、ミラーは通常、周囲に似た内容を反映するため、2つを区別することは非常に難しいことです。この論文では、入力画像からミラーをセグメント化する新しい方法を提示します。私たちの知る限り、これは計算アプローチでミラーセグメンテーション問題に対処する最初の作業です。以下の貢献をします。最初に、対応する手動注釈付きマスクを持つミラー画像を含む大規模なミラーデータセットを構築します。このデータセットは、さまざまな日常生活の場面を対象としており、将来の研究のために公開されます。第二に、ミラーの内側と外側のコンテンツ間の意味的および低レベルの色/テクスチャの不連続性をモデリングすることにより、ミラーセグメンテーションのためのMirrorNetと呼ばれる新しいネットワークを提案します。第三に、提案された方法を評価するために大規模な実験を行い、最先端の検出およびセグメンテーション方法から慎重に選択されたベースラインよりも優れていることを示します。
Mirrors are everywhere in our daily lives. Existing computer vision systems do not consider mirrors, and hence may get confused by the reflected content inside a mirror, resulting in a severe performance degradation. However, separating the real content outside a mirror from the reflected content inside it is non-trivial. The key challenge is that mirrors typically reflect contents similar to their surroundings, making it very difficult to differentiate the two. In this paper, we present a novel method to segment mirrors from an input image. To the best of our knowledge, this is the first work to address the mirror segmentation problem with a computational approach. We make the following contributions. First, we construct a large-scale mirror dataset that contains mirror images with corresponding manually annotated masks. This dataset covers a variety of daily life scenes, and will be made publicly available for future research. Second, we propose a novel network, called MirrorNet, for mirror segmentation, by modeling both semantical and low-level color/texture discontinuities between the contents inside and outside of the mirrors. Third, we conduct extensive experiments to evaluate the proposed method, and show that it outperforms the carefully chosen baselines from the state-of-the-art detection and segmentation methods.