過去数十年にわたって、手作りの特徴抽出器を使用して、画像の視覚的特性を特徴ベクトルにエンコードしてきました。最近、データ駆動型の特徴学習アプローチが、より代表的な視覚的特徴を生成するための代替手段として首尾よく探求されてきました。この作業では、色の量子化の問題に焦点を当てて、両方の研究会場を組み合わせます。最適化された量子化スキームの検索を通じて画像表現を学習するための2つのデータ駆動型アプローチを提案します。これにより、より効果的な特徴抽出アルゴリズムとコンパクトな表現が実現します。私たちの戦略は、情報検索関連の最適化問題でうまく利用されているソフトコンピューティング装置である遺伝的アルゴリズムを採用しています。量子化を変更すると、画像記述アプローチの品質に影響を与え、効果的かつ効率的な表現につながると仮定します。さまざまな視覚的特性を持つ8つのよく知られたデータセットを考慮して、コンテンツベースの画像検索タスクにおけるアプローチを評価します。結果は、表現の有効性に焦点を当てたアプローチが、テストされたすべてのシナリオでベースラインを上回ったことを示しています。作成された表現のサイズも考慮するもう1つのアプローチは、特徴ベクトルの次元を最大25%維持または削減することで、競争力のある結果を生み出しました。
Over the last decades, hand-crafted feature extractors have been used to encode image visual properties into feature vectors. Recently, data-driven feature learning approaches have been successfully explored as alternatives for producing more representative visual features. In this work, we combine both research venues, focusing on the color quantization problem. We propose two data-driven approaches to learn image representations through the search for optimized quantization schemes, which lead to more effective feature extraction algorithms and compact representations. Our strategy employs Genetic Algorithm, a soft-computing apparatus successfully utilized in Information-retrieval-related optimization problems. We hypothesize that changing the quantization affects the quality of image description approaches, leading to effective and efficient representations. We evaluate our approaches in content-based image retrieval tasks, considering eight well-known datasets with different visual properties. Results indicate that the approach focused on representation effectiveness outperformed baselines in all tested scenarios. The other approach, which also considers the size of created representations, produced competitive results keeping or even reducing the dimensionality of feature vectors up to 25%.