回転スパースコーディングのアルゴリズムと、操縦性を使用した効率的な実装を提案します。スパースコーディング(辞書学習とも呼ばれます)は、画像処理の重要な手法であり、逆問題、圧縮、分析に役立ちます。ただし、通常の定式化では、画像の構造の重要な側面を捉えることができません。画像は、さまざまな場所、向き、スケールで現れるエッジ、ライン、ポイントなどのビルディングブロックから形成されます。スパースコーディングの問題は、これらの変換を明示的に説明するために再計算できますが、計算量が増えます。この作業では、追加の回転操作を伴うK-SVDに基づくスパースコーディングの回転バージョンのアルゴリズムを提案します。次に、操作可能な方法で辞書を学習することにより、これらの回転を加速する方法を提案します。パッチコーディングとテクスチャ分類に関する実験では、提案されたアルゴリズムが実用上十分に高速であり、標準のスパースコーディングと比較して優れていることが実証されています。
We propose an algorithm for rotational sparse coding along with an efficient implementation using steerability. Sparse coding (also called dictionary learning) is an important technique in image processing, useful in inverse problems, compression, and analysis; however, the usual formulation fails to capture an important aspect of the structure of images: images are formed from building blocks, e.g., edges, lines, or points, that appear at different locations, orientations, and scales. The sparse coding problem can be reformulated to explicitly account for these transforms, at the cost of increased computation. In this work, we propose an algorithm for a rotational version of sparse coding that is based on K-SVD with additional rotation operations. We then propose a method to accelerate these rotations by learning the dictionary in a steerable basis. Our experiments on patch coding and texture classification demonstrate that the proposed algorithm is fast enough for practical use and compares favorably to standard sparse coding.