ICCV 2019学習でセグメンテーションマスクを使用してチャレンジを推進する
Using Segmentation Masks in the ICCV 2019 Learning to Drive Challenge
  この作業では、カメラ画像フレームが与えられた場合の車両速度とステアリング角度を予測します。私たちの主要な貢献は、セグメンテーションに外部の事前学習済みニューラルネットワークを使用することです。生の画像にセグメンテーションマスクとミラー画像を追加します。 3つの多様なニューラルネットワークモデルを組み合わせます(i)単一の画像とそのセグメンテーションマスクを使用するCNN、(ii)入力として一連の画像とセグメンテーションマスクを使用するスタックCNN、および(iii)を使用して画像特徴を抽出する双方向GRU事前にトレーニングされたResNet34、DenseNet121、および当社独自のCNNシングルイメージモデル。 MSEアングルで2番目に優れたパフォーマンスと、全体で2番目に高いパフォーマンスを達成し、ICCV Learning to Driveチャレンジで2位になりました。モデルとコードを公開します。
In this work we predict vehicle speed and steering angle given camera image frames. Our key contribution is using an external pre-trained neural network for segmentation. We augment the raw images with their segmentation masks and mirror images. We ensemble three diverse neural network models (i) a CNN using a single image and its segmentation mask, (ii) a stacked CNN taking as input a sequence of images and segmentation masks, and (iii) a bidirectional GRU, extracting image features using a pre-trained ResNet34, DenseNet121 and our own CNN single image model. We achieve the second best performance for MSE angle and second best performance overall, to win 2nd place in the ICCV Learning to Drive challenge. We make our models and code publicly available.
