arXiv reaDer
LILE:他の場所を探す前に詳細を調べる-組織病理学アーカイブでのクロスモーダル情報検索にトランスフォーマーを使用したデュアルアテンションネットワーク
LILE: Look In-Depth before Looking Elsewhere -- A Dual Attention Network using Transformers for Cross-Modal Information Retrieval in Histopathology Archives
近年、多くのアプリケーションで利用可能なデータの量が劇的に増加しています。さらに、複数のモダリティを別々に使用していたネットワークの時代は事実上終わりました。したがって、処理可能な双方向のクロスモダリティデータ検索を可能にすることは、多くのドメインおよび研究分野の要件になっています。これは特に医療分野に当てはまります。データには、分子データだけでなく、さまざまな種類の画像やレポートなど、さまざまな種類があります。ほとんどの現代作品は、他のモダリティに関連して画像やテキストの本質的な要素を強調し、それらを一致させようとするためにクロスアテンションを適用しています。ただし、独自のモダリティでの重要性に関係なく、これらのアプローチでは通常、各モダリティの機能を同等に考慮します。この研究では、クロスアテンションモジュールに提供される内部表現を充実させるために、追加の損失項としての自己注意が提案されます。この作品は、共同潜在空間の画像とテキストを表現するのに役立つ新しい損失項を備えた新しいアーキテクチャを提案しています。 2つのベンチマークデータセット、つまりMS-COCOとARCHでの実験結果は、提案された方法の有効性を示しています。
The volume of available data has grown dramatically in recent years in many applications. Furthermore, the age of networks that used multiple modalities separately has practically ended. Therefore, enabling bidirectional cross-modality data retrieval capable of processing has become a requirement for many domains and disciplines of research. This is especially true in the medical field, as data comes in a multitude of types, including various types of images and reports as well as molecular data. Most contemporary works apply cross attention to highlight the essential elements of an image or text in relation to the other modalities and try to match them together. However, regardless of their importance in their own modality, these approaches usually consider features of each modality equally. In this study, self-attention as an additional loss term will be proposed to enrich the internal representation provided into the cross attention module. This work suggests a novel architecture with a new loss term to help represent images and texts in the joint latent space. Experiment results on two benchmark datasets, i.e. MS-COCO and ARCH, show the effectiveness of the proposed method.
updated: Fri Mar 04 2022 06:08:09 GMT+0000 (UTC)
published: Wed Mar 02 2022 22:42:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト