arXiv reaDer
GPRAR:人間の軌道予測のためのグラフ畳み込みネットワークベースのポーズ再構成と行動認識
GPRAR: Graph Convolutional Network based Pose Reconstruction and Action Recognition for Human Trajectory Prediction
自動運転などのさまざまな用途には、高精度な予測が欠かせません。既存の予測モデルは、観測(たとえば、人間のポーズや場所)にノイズが多い現実の設定では、エラーが発生しやすくなります。この問題に対処するために、人間の軌道予測のためのグラフ畳み込みネットワークベースのポーズ再構築と行動認識であるGPRARを紹介します。 GPRARの重要なアイデアは、ノイズの多いシナリオの下で、人間のポーズとアクションという堅牢な機能を生成することです。この目的のために、PRAR(ポーズの再構築と行動認識)とFA(機能アグリゲーター)の2つの新しいサブネットワークを使用してGPRARを設計します。 PRARは、人間の骨格のコヒーレントで構造的な特性から、人間のポーズとアクションの特徴を同時に再構築することを目的としています。これは、エンコーダーと2つのデコーダーのネットワークであり、それぞれが時空間グラフ畳み込みネットワークの複数の層で構成されています。さらに、学習した特徴(人間のポーズ、アクション、場所、カメラの動き)を、エンコーダーデコーダーベースの時間畳み込みニューラルネットワークを使用してチャネルごとに集約し、将来の場所を予測する機能アグリゲーター(FA)を提案します。一般的に使用されるデータセットでの広範な実験:JAAD [13]およびTITAN [19]は、最先端のモデルよりもGPRARの精度が向上していることを示しています。具体的には、GPRARは、JAADデータセットとTITANデータセットでのノイズの多い観測の下で、予測精度をそれぞれ最大22%と50%向上させます。
Prediction with high accuracy is essential for various applications such as autonomous driving. Existing prediction models are easily prone to errors in real-world settings where observations (e.g. human poses and locations) are often noisy. To address this problem, we introduce GPRAR, a graph convolutional network based pose reconstruction and action recognition for human trajectory prediction. The key idea of GPRAR is to generate robust features: human poses and actions, under noisy scenarios. To this end, we design GPRAR using two novel sub-networks: PRAR (Pose Reconstruction and Action Recognition) and FA (Feature Aggregator). PRAR aims to simultaneously reconstruct human poses and action features from the coherent and structural properties of human skeletons. It is a network of an encoder and two decoders, each of which comprises multiple layers of spatiotemporal graph convolutional networks. Moreover, we propose a Feature Aggregator (FA) to channel-wise aggregate the learned features: human poses, actions, locations, and camera motion using encoder-decoder based temporal convolutional neural networks to predict future locations. Extensive experiments on the commonly used datasets: JAAD [13] and TITAN [19] show accuracy improvements of GPRAR over state-of-theart models. Specifically, GPRAR improves the prediction accuracy up to 22% and 50% under noisy observations on JAAD and TITAN datasets, respectively
updated: Thu Mar 25 2021 20:12:14 GMT+0000 (UTC)
published: Thu Mar 25 2021 20:12:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト