Improving Deep Image Clustering With Spatial Transformer Layers
  画像のクラスタリングは、機械学習において重要ですが挑戦的なタスクです。ほとんどの画像処理分野と同様に、最新の改善点は、ディープラーニングアプローチに基づくモデルによるものです。ただし、従来の深層学習方法には、スケールや回転などの空間画像変換を処理する問題があります。本論文では、画像クラスタリング手法におけるこの問題を軽減するために、視覚的注意技術の使用を提案します。 Deep Adaptive Clustering(DAC)と呼ばれるディープイメージクラスタリングモデルとSpatial Transformer Networks(STN)の組み合わせを評価します。提案されたモデルは、データセットMNISTおよびFashionMNISTで評価され、ベースラインモデルを上回りました。
Image clustering is an important but challenging task in machine learning. As in most image processing areas, the latest improvements came from models based on the deep learning approach. However, classical deep learning methods have problems to deal with spatial image transformations like scale and rotation. In this paper, we propose the use of visual attention techniques to reduce this problem in image clustering methods. We evaluate the combination of a deep image clustering model called Deep Adaptive Clustering (DAC) with the Spatial Transformer Networks (STN). The proposed model is evaluated in the datasets MNIST and FashionMNIST and outperformed the baseline model.
updated: Thu Oct 24 2019 13:43:23 GMT+0000 (UTC)
published: Sat Feb 09 2019 01:56:24 GMT+0000 (UTC)
