arXiv reaDer
クロスモーダル学習のための識別的意味論的推移的一貫性
Discriminative Semantic Transitive Consistency for Cross-Modal Learning
クロスモーダル検索は、通常、2つの異なるモダリティからのデータを共有表現空間に投影および整列することによって実行されます。この共有スペースは、多くの場合、モダリティを変換するためのブリッジとしても機能します。他のモダリティに転送された後でもデータポイントが正しく分類されるようにするために、Discriminative Semantic Transitive Consistencyのプロパティを提案して活用することにより、このような表現空間を学習する問題に対処します。セマンティック推移性の一貫性に加えて、従来の距離最小化制約も適用します。これにより、両方のモダリティからの対応するデータポイントの射影が、表現空間に近づきます。タスクについて、損失条件とそれらの交互作用の両方の寄与を分析および比較します。さらに、各モダリティのセマンティックサイクルの一貫性を組み込みます。明確なアブレーション研究により、さまざまなコンポーネントにより、より優れたパフォーマンスを実証します。また、提案を裏付ける定性的な結果も提供します。
Cross-modal retrieval is generally performed by projecting and aligning the data from two different modalities onto a shared representation space. This shared space often also acts as a bridge for translating the modalities. We address the problem of learning such representation space by proposing and exploiting the property of Discriminative Semantic Transitive Consistency -- ensuring that the data points are correctly classified even after being transferred to the other modality. Along with semantic transitive consistency, we also enforce the traditional distance minimizing constraint which makes the projections of the corresponding data points from both the modalities to come closer in the representation space. We analyze and compare the contribution of both the loss terms and their interaction, for the task. In addition, we incorporate semantic cycle-consistency for each of the modality. We empirically demonstrate better performance owing to the different components with clear ablation studies. We also provide qualitative results to support the proposals.
updated: Thu Mar 25 2021 19:45:24 GMT+0000 (UTC)
published: Thu Mar 25 2021 19:45:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト