イメージピラミッドは、多くのオブジェクト検出アルゴリズムを拡張して、複数のスケールでの検出を解決できます。ただし、画像ピラミッドのリサンプリングプロセス中の補間により、勾配の変動が生じます。これは、元の画像とスケーリングされた画像の勾配の差です。重要な洞察は、勾配の分散の増加により、分類器がカテゴリを正しく割り当てることが困難になることです。元の画像とスケーリングされた画像の間の勾配期待値の比を定式化することにより勾配変動の存在を証明し、この変動の影響を排除するための簡単で新しい勾配正規化法を提案します。提案された正規化方法は、画像ピラミッドの分散を低減し、分類器がより小さいカバレッジに集中できるようにします。 3つの異なる視覚認識の問題の改善を示します:歩行者検出、姿勢推定、および物体検出。この方法は一般に、勾配のある画像ピラミッドに基づく多くの視覚アルゴリズムに適用できます。
An image pyramid can extend many object detection algorithms to solve detection on multiple scales. However, interpolation during the resampling process of an image pyramid causes gradient variation, which is the difference of the gradients between the original image and the scaled images. Our key insight is that the increased variance of gradients makes the classifiers have difficulty in correctly assigning categories. We prove the existence of the gradient variation by formulating the ratio of gradient expectations between an original image and scaled images, then propose a simple and novel gradient normalization method to eliminate the effect of this variation. The proposed normalization method reduce the variance in an image pyramid and allow the classifier to focus on a smaller coverage. We show the improvement in three different visual recognition problems: pedestrian detection, pose estimation, and object detection. The method is generally applicable to many vision algorithms based on an image pyramid with gradients.