arXiv reaDer
ビデオに基づいた対話のためのセマンティックグラフ上の推論パスの学習
Learning Reasoning Paths over Semantic Graphs for Video-grounded Dialogues
従来の視覚的な質問応答と比較して、ビデオに基づいた対話では、マルチターン設定で質問に回答するために、対話コンテキストに関する追加の推論が必要です。ビデオベースのダイアログへの以前のアプローチは、ほとんどの場合、ターンレベルで固有の情報フローをモデル化せずに、ダイアログコンテキストを単純なテキスト入力として使用します。この論文では、対話コンテキスト(PDC)における推論パスの新しいフレームワークを提案します。 PDCモデルは、各質問と回答の語彙コンポーネントに基づいて構築されたセマンティックグラフを介して、ダイアログターン間の情報フローを検出します。次に、PDCモデルは、このセマンティックグラフ上の推論パスを予測することを学習します。私たちのパス予測モデルは、現在のターンから、現在の質問に答えるための追加の視覚的な手がかりを含む過去のダイアログターンまでのパスを予測します。私たちの推論モデルは、この推論パスを介して視覚情報とテキスト情報の両方を順次処理し、伝播された機能を使用して回答を生成します。私たちの実験結果は、私たちの方法の有効性を示し、モデルが対話コンテキストでセマンティック依存関係を使用して視覚的な手がかりを取得する方法に関する追加の洞察を提供します。
Compared to traditional visual question answering, video-grounded dialogues require additional reasoning over dialogue context to answer questions in a multi-turn setting. Previous approaches to video-grounded dialogues mostly use dialogue context as a simple text input without modelling the inherent information flows at the turn level. In this paper, we propose a novel framework of Reasoning Paths in Dialogue Context (PDC). PDC model discovers information flows among dialogue turns through a semantic graph constructed based on lexical components in each question and answer. PDC model then learns to predict reasoning paths over this semantic graph. Our path prediction model predicts a path from the current turn through past dialogue turns that contain additional visual cues to answer the current question. Our reasoning model sequentially processes both visual and textual information through this reasoning path and the propagated features are used to generate the answer. Our experimental results demonstrate the effectiveness of our method and provide additional insights on how models use semantic dependencies in a dialogue context to retrieve visual cues.
updated: Mon Mar 01 2021 07:39:26 GMT+0000 (UTC)
published: Mon Mar 01 2021 07:39:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト