arXiv reaDer
言語ベースのセグメンテーションのための事前学習済み画像分類器の活用
Leveraging Pretrained Image Classifiers for Language-Based Segmentation
 現在のセマンティックセグメンテーションモデルは、電車の時間中に見えない新しいオブジェクトクラスに簡単に一般化できません。追加の注釈付き画像と再トレーニングが必要です。セマンティックセグメンテーションアーキテクチャに視覚的な優先順位を注入する新しいセグメンテーションモデルを提案し、再トレーニングなしで新しいターゲットラベルをセグメント化できるようにします。視覚的な優先事項として、シーン内のターゲットオブジェクトとディストラクタオブジェクトの両方の空間的位置のノイズの多い表示を提供する、事前学習済みの画像分類器のアクティブ化を使用します。言語セマンティクスを活用して、分類子によって見えないターゲットラベルのこれらのアクティベーションを取得します。さらなる実験により、関連するオブジェクトと注意をそらすオブジェクトの両方について、言語セマンティクスを介して取得された視覚的な事前確率がパフォーマンスの鍵であることが示されています。
Current semantic segmentation models cannot easily generalize to new object classes unseen during train time: they require additional annotated images and retraining. We propose a novel segmentation model that injects visual priors into semantic segmentation architectures, allowing them to segment out new target labels without retraining. As visual priors, we use the activations of pretrained image classifiers, which provide noisy indications of the spatial location of both the target object and distractor objects in the scene. We leverage language semantics to obtain these activations for a target label unseen by the classifier. Further experiments show that the visual priors obtained via language semantics for both relevant and distracting objects are key to our performance.
updated: Tue Mar 10 2020 21:01:01 GMT+0000 (UTC)
published: Sun Nov 03 2019 05:03:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト