arXiv reaDer
シーン認識のためのセマンティック埋め込み類似性プロトタイプ
Semantic-embedded Similarity Prototype for Scene Recognition
シーン内の複雑な構成とシーン間で共存するオブジェクトによって引き起こされるクラス間の類似性が高いため、シーン認識を向上させるために、さまざまな研究でシーン内のオブジェクトの意味論的な知識が調査されてきました。ただし、セマンティック セグメンテーションまたはオブジェクト検出技術は大量の計算能力を必要とするため、ネットワークにかなりの負担がかかるため、結果として問題が発生します。この制限により、多くの場合、オブジェクト支援アプローチはエッジ デバイスと互換性がなくなります。対照的に、この論文では、シーン認識ネットワークがネットワーク パラメーターを増やすことなくより高い精度を達成できるように支援する、セマンティック ベースの類似性プロトタイプを提案します。シンプルで、既存のパイプラインにプラグアンドプレイで使用できます。より具体的には、シーン内の意味論的な知識をクラスレベルの意味論的表現として表現するために、統計的戦略が導入されます。これらの表現はクラス間の相関関係を調査するために利用され、最終的に類似性プロトタイプを構築します。さらに、類似性プロトタイプを使用して、それぞれ勾配ラベルの軟化とバッチレベルのコントラスト損失の観点からネットワークトレーニングをサポートする 2 つの方法を提案します。複数のベンチマークでの包括的な評価により、類似性プロトタイプが計算負荷を追加することなく既存のネットワークのパフォーマンスを向上させることがわかりました。コードと統計的類似性のプロトタイプは間もなく利用可能になります。
Due to the high inter-class similarity caused by the complex composition within scenes and the co-existing objects across scenes, various studies have explored object semantic knowledge within scenes to improve scene recognition. However, a resulting issue arises as semantic segmentation or object detection techniques demand heavy computational power, thereby burdening the network considerably. This limitation often renders object-assisted approaches incompatible with edge devices. In contrast, this paper proposes a semantic-based similarity prototype that assists the scene recognition network to achieve higher accuracy without increasing network parameters. It is simple and can be plug-and-played into existing pipelines. More specifically, a statistical strategy is introduced to depict semantic knowledge in scenes as class-level semantic representations. These representations are utilized to explore inter-class correlations, ultimately constructing a similarity prototype. Furthermore, we propose two ways to use the similarity prototype to support network training from the perspective of gradient label softening and batch-level contrastive loss, respectively. Comprehensive evaluations on multiple benchmarks show that our similarity prototype enhances the performance of existing networks without adding any computational burden. Code and the statistical similarity prototype will be available soon.
updated: Fri Aug 11 2023 01:11:46 GMT+0000 (UTC)
published: Fri Aug 11 2023 01:11:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト