arXiv reaDer
幾何学的コンテキストを使用したシーングラフの生成
Scene Graph Generation with Geometric Context
シーングラフの生成は、視覚的な質問応答、画像のキャプション、自動運転車、群衆の行動分析、活動認識などの画像理解プロジェクトに対する需要の高まりとともに、コンピュータービジョンの研究で大きな注目を集めています。画像の視覚的に根拠のあるグラフィカル構造であるシーングラフは、画像理解タスクを簡素化するのに非常に役立ちます。この作業では、視覚的なシーンをより幾何学的に理解するために、GeometricContextと呼ばれる後処理アルゴリズムを導入しました。この後処理アルゴリズムを使用して、オブジェクトペア間の幾何学的関係を前のモデルに追加および改良します。オブジェクトペア間の方向と距離を計算することにより、このコンテキストを活用します。ベースラインモデルとしてKnowledgeEmbedded Routing Network(KERN)を使用し、アルゴリズムを使用して作業を拡張し、最近の最先端のアルゴリズムで同等の結果を示します。
Scene Graph Generation has gained much attention in computer vision research with the growing demand in image understanding projects like visual question answering, image captioning, self-driving cars, crowd behavior analysis, activity recognition, and more. Scene graph, a visually grounded graphical structure of an image, immensely helps to simplify the image understanding tasks. In this work, we introduced a post-processing algorithm called Geometric Context to understand the visual scenes better geometrically. We use this post-processing algorithm to add and refine the geometric relationships between object pairs to a prior model. We exploit this context by calculating the direction and distance between object pairs. We use Knowledge Embedded Routing Network (KERN) as our baseline model, extend the work with our algorithm, and show comparable results on the recent state-of-the-art algorithms.
updated: Thu Nov 25 2021 15:42:21 GMT+0000 (UTC)
published: Thu Nov 25 2021 15:42:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト