arXiv reaDer
画像キャプションのための明示的および暗黙的な視覚的関係の調査
Exploring Explicit and Implicit Visual Relationships for Image Captioning
画像のキャプションはAIで最も難しいタスクの1つであり、画像のテキスト文を自動的に生成することを目的としています。画像キャプションの最近の方法は、画像内の顕著な領域のシーケンスを自然言語の説明に変換するエンコーダ-デコーダフレームワークに従います。ただし、これらのモデルは通常、オブジェクト間のさまざまな視覚的関係に反映されるコンテキストの相互作用の包括的な理解を欠いています。この論文では、画像のキャプションの領域レベルの表現を充実させるために、明示的および暗黙的な視覚的関係を探ります。明示的に、オブジェクトペア上にセマンティックグラフを構築し、ゲートグラフ畳み込みネットワーク(ゲートGCN)を利用して、ローカルネイバーの情報を選択的に集約します。暗黙的に、追加のリレーショナルアノテーションなしで、トランスフォーマー(Region BERT)からのリージョンベースの双方向エンコーダー表現を介して、検出されたオブジェクト間のグローバルな相互作用を描画します。提案された方法の有効性と優位性を評価するために、Microsoft COCOベンチマークで広範な実験を行い、強力なベースラインと比較して顕著な改善を達成しました。
Image captioning is one of the most challenging tasks in AI, which aims to automatically generate textual sentences for an image. Recent methods for image captioning follow encoder-decoder framework that transforms the sequence of salient regions in an image into natural language descriptions. However, these models usually lack the comprehensive understanding of the contextual interactions reflected on various visual relationships between objects. In this paper, we explore explicit and implicit visual relationships to enrich region-level representations for image captioning. Explicitly, we build semantic graph over object pairs and exploit gated graph convolutional networks (Gated GCN) to selectively aggregate local neighbors' information. Implicitly, we draw global interactions among the detected objects through region-based bidirectional encoder representations from transformers (Region BERT) without extra relational annotations. To evaluate the effectiveness and superiority of our proposed method, we conduct extensive experiments on Microsoft COCO benchmark and achieve remarkable improvements compared with strong baselines.
updated: Thu May 06 2021 01:47:51 GMT+0000 (UTC)
published: Thu May 06 2021 01:47:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト