プーリング操作によって引き起こされる並進不変性は、畳み込みニューラルネットワークの固有の特性であり、分類などの多数のコンピュータービジョンタスクを容易にします。しかし、回転不変タスクを活用するには、畳み込みアーキテクチャでは、特定の回転不変レイヤーまたは広範なデータ拡張を使用して、特定の空間構成のさまざまな回転バージョンから学習する必要があります。画像を極座標にアンラップすると、回転不変性が並進になるときに畳み込みアーキテクチャをトレーニングするためのより明確な表現が提供されます。したがって、特定のシーンの視覚的には異なるが同等の回転バージョンを単一の画像から学習できます。 2つの一般的なビジョンベースの太陽放射照度予測の課題(つまり、地上で撮影した空の画像または衛星画像を使用)で、この前処理ステップにより、シーン表現を標準化することで予測結果が大幅に向上し、トレーニング時間が4分の1に短縮されることを示します。回転によるデータの拡張。さらに、この変換により、回転の中心を囲む領域が拡大され、より正確な短期放射照度予測が可能になります。
Translational invariance induced by pooling operations is an inherent property of convolutional neural networks, which facilitates numerous computer vision tasks such as classification. Yet to leverage rotational invariant tasks, convolutional architectures require specific rotational invariant layers or extensive data augmentation to learn from diverse rotated versions of a given spatial configuration. Unwrapping the image into its polar coordinates provides a more explicit representation to train a convolutional architecture as the rotational invariance becomes translational, hence the visually distinct but otherwise equivalent rotated versions of a given scene can be learnt from a single image. We show with two common vision-based solar irradiance forecasting challenges (i.e. using ground-taken sky images or satellite images), that this preprocessing step significantly improves prediction results by standardising the scene representation, while decreasing training time by a factor of 4 compared to augmenting data with rotations. In addition, this transformation magnifies the area surrounding the centre of the rotation, leading to more accurate short-term irradiance predictions.