arXiv reaDer
因子グラフの注意
Factor Graph Attention
 対話は情報を交換する効果的な方法ですが、微妙な詳細とニュアンスは非常に重要です。大幅な進歩により、アルゴリズムを使用して視覚的なダイアログに対処する道が開かれましたが、詳細とニュアンスは課題のままです。注意メカニズムは、視覚的な質問応答の詳細を抽出し、解釈可能性と有効性のために視覚的な対話の説得力のあるフレームワークを提供する魅力的な結果を実証しています。ただし、ビジュアルダイアログに付随する多くのデータユーティリティは、既存のアテンションテクニックに挑戦します。この問題に対処し、任意の数のデータユーティリティで動作するビジュアルダイアログの一般的な注意メカニズムを開発します。この目的のために、任意の数のユーティリティ表現を組み合わせたファクターグラフベースのアテンションメカニズムを設計します。挑戦的で最近導入されたVisDialデータセットに対する提案されたアプローチの適用可能性を示し、最近の最先端の方法をVisDial0.9で1.1%、MRRでVisDial1.0で2%上回る。アンサンブルモデルにより、VisDial1.0のMRRスコアが6%以上改善されました。
Dialog is an effective way to exchange information, but subtle details and nuances are extremely important. While significant progress has paved a path to address visual dialog with algorithms, details and nuances remain a challenge. Attention mechanisms have demonstrated compelling results to extract details in visual question answering and also provide a convincing framework for visual dialog due to their interpretability and effectiveness. However, the many data utilities that accompany visual dialog challenge existing attention techniques. We address this issue and develop a general attention mechanism for visual dialog which operates on any number of data utilities. To this end, we design a factor graph based attention mechanism which combines any number of utility representations. We illustrate the applicability of the proposed approach on the challenging and recently introduced VisDial datasets, outperforming recent state-of-the-art methods by 1.1% for VisDial0.9 and by 2% for VisDial1.0 on MRR. Our ensemble model improved the MRR score on VisDial1.0 by more than 6%.
updated: Sat Mar 07 2020 23:35:13 GMT+0000 (UTC)
published: Thu Apr 11 2019 17:59:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト