arXiv reaDer
ドメイン汎化におけるドメイン認識トリプレット損失
Domain-aware Triplet loss in Domain Generalization
深層学習の進歩により、物体認識の分野では多くの進歩が見られますが、深層学習モデルのパフォーマンスに悪影響を与える要因がまだいくつかあります。ドメイン シフトはこれらの要因の 1 つであり、テスト データとトレーニング データの分布の不一致によって引き起こされます。このホワイト ペーパーでは、マルチドメイン データからの埋め込み空間の最適化を支援するために、ドメインの一般化におけるコンパクトな特徴クラスタリングの問題に焦点を当てます。モデルが同様のセマンティック機能をクラスター化するだけでなく、ドメインから生じる機能を分散させるのにも役立つように、ドメイン一般化のためのドメイン認識トリプレット損失を設計します。分布の配置に焦点を当てた以前の方法とは異なり、私たちのアルゴリズムは埋め込み空間にドメイン情報を分散させるように設計されています。基本的なアイデアは、ドメイン情報に基づいて埋め込み機能をクラスター化できるという仮定に基づいて動機付けられています。これは、このペーパーで数学的および経験的にサポートされています。さらに、ドメインの一般化における特徴クラスタリングの調査中に、ドメインの一般化におけるメトリック学習損失の収束に影響を与える要因は、事前定義されたドメインよりも重要であることに気付きました。この問題を解決するために、2 つの方法を使用して埋め込み空間を正規化し、埋め込み機能の内部共変量シフトを減らします。アブレーション研究は、アルゴリズムの有効性を示しています。さらに、PACS、VLCS、Office-Home などのベンチマーク データセットでの実験では、ドメインの不一致に焦点を当てた関連する方法よりも、この方法の方が優れていることが示されています。特に、RegnetY-16 での結果は、ベンチマーク データセットでの最先端の方法よりも大幅に優れています。私たちのコードは https://github.com/workerbcd/DCT でリリースされます
Despite much progress being made in the field of object recognition with the advances of deep learning, there are still several factors negatively affecting the performance of deep learning models. Domain shift is one of these factors and is caused by discrepancies in the distributions of the testing and training data. In this paper, we focus on the problem of compact feature clustering in domain generalization to help optimize the embedding space from multi-domain data. We design a domainaware triplet loss for domain generalization to help the model to not only cluster similar semantic features, but also to disperse features arising from the domain. Unlike previous methods focusing on distribution alignment, our algorithm is designed to disperse domain information in the embedding space. The basic idea is motivated based on the assumption that embedding features can be clustered based on domain information, which is mathematically and empirically supported in this paper. In addition, during our exploration of feature clustering in domain generalization, we note that factors affecting the convergence of metric learning loss in domain generalization are more important than the pre-defined domains. To solve this issue, we utilize two methods to normalize the embedding space, reducing the internal covariate shift of the embedding features. The ablation study demonstrates the effectiveness of our algorithm. Moreover, the experiments on the benchmark datasets, including PACS, VLCS and Office-Home, show that our method outperforms related methods focusing on domain discrepancy. In particular, our results on RegnetY-16 are significantly better than state-of-the-art methods on the benchmark datasets. Our code will be released at https://github.com/workerbcd/DCT
updated: Wed Mar 01 2023 14:02:01 GMT+0000 (UTC)
published: Wed Mar 01 2023 14:02:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト