このペーパーでは、ワンショットテクスチャ検索に取り組みます。新しい参照テクスチャの例を挙げて、任意の画像内の同じテクスチャカテゴリのすべてのピクセルを検出してセグメント化します。この問題に対処するために、リファレンスとクエリの両方の画像をエンコードするOS-TRネットワークを提示し、リファレンスカテゴリに向けたテクスチャセグメンテーションを実現します。 CNNを無秩序なプーリングと統合する既存のテクスチャエンコーディング方法とは異なり、方向性に対応したモジュールを提案して、各方向でのテクスチャの変化をキャプチャし、空間的に不変の表現をもたらします。少数の例のみが与えられた新しいカテゴリをセグメント化するために、自己ゲーティングメカニズムを関係ネットワークに組み込んで、ローカル関係機能のチャネルごとの変調の重みを調整するためのグローバルコンテキスト情報を活用します。ベンチマークテクスチャデータセットと実際のシナリオに関する広範な実験は、提案された方法のドメイン全体で、上記のセグメンテーションパフォーマンスと堅牢な一般化を実証します。
In this paper, we tackle one-shot texture retrieval: given an example of a new reference texture, detect and segment all the pixels of the same texture category within an arbitrary image. To address this problem, we present an OS-TR network to encode both reference and query image, leading to achieve texture segmentation towards the reference category. Unlike the existing texture encoding methods that integrate CNN with orderless pooling, we propose a directionality-aware module to capture the texture variations at each direction, resulting in spatially invariant representation. To segment new categories given only few examples, we incorporate a self-gating mechanism into relation network to exploit global context information for adjusting per-channel modulation weights of local relation features. Extensive experiments on benchmark texture datasets and real scenarios demonstrate the above-par segmentation performance and robust generalization across domains of our proposed method.