都市のすべての地域における配車サービスの需要をまとめて予測するために、ディープラーニングアプローチが適用され、すばらしい結果が得られました。ただし、都市の地理的レイアウト全体にわたる局所的な統計の違いにより、畳み込みの空間的定常性の仮定が無効になり、需要予測タスクでのCNNのパフォーマンスが制限されます。このペーパーでは、LC-ST-FCN(ローカルに接続された時空間完全畳み込みニューラルネットワーク)と呼ばれる新しい深層学習フレームワークを提案し、1つのエンドツーエンドアーキテクチャ(E2E)内の地域レベルの需要予測問題の固有の課題に対処します)。最初に3Dたたみ込み層を使用して、入力に存在する空間情報と時間情報を融合し、3Dたたみ込み層によって抽出された時空間特徴を後続の2Dたたみ込み層にフィードします。その後、各領域の予測値は、パラメータ共有方式を緩和するローカルに接続された畳み込み層によって取得されます。ライドソーシングサービスプラットフォーム(DiDiChuxing)からの実際のデータセットで提案されたモデルを評価し、一連のベースラインモデルと比較して大幅な改善を観察します。さらに、さまざまなタイプの畳み込み層が入力を変換し、有用な機能をキャプチャする方法を視覚化することにより、提案されたモデルの有効性も示します。可視化の結果は、完全にたたみ込みアーキテクチャにより、モデルが関連する領域をより適切にローカライズできることを示しています。また、ローカルに接続されたレイヤーは、ローカルの統計的差異を処理し、有用な領域をアクティブ化する上で重要な役割を果たします。
To collectively forecast the demand for ride-sourcing services in all regions of a city, the deep learning approaches have been applied with commendable results. However, the local statistical differences throughout the geographical layout of the city make the spatial stationarity assumption of the convolution invalid, which limits the performance of CNNs on the demand forecasting task. In this paper, we propose a novel deep learning framework called LC-ST-FCN (locally connected spatiotemporal fully-convolutional neural network) to address the unique challenges of the region-level demand forecasting problem within one end-to-end architecture (E2E). We first employ the 3D convolutional layers to fuse the spatial and temporal information existed in the input and then feed the spatiotemporal features extracted by the 3D convolutional layers to the subsequent 2D convolutional layers. Afterward, the prediction value of each region is obtained by the locally connected convolutional layers which relax the parameter sharing scheme. We evaluate the proposed model on a real dataset from a ride-sourcing service platform (DiDiChuxing) and observe significant improvements compared with a bunch of baseline models. Besides, we also illustrate the effectiveness of our proposed model by visualizing how different types of convolutional layers transform their input and capture useful features. The visualization results show that fully convolutional architecture enables the model to better localize the related regions. And the locally connected layers play an important role in dealing with the local statistical differences and activating useful regions.