arXiv reaDer
Color-to-Gray プロジェクション オペレータのイコライゼーション モードと輝度マッピング モード
Equalization and Brightness Mapping Modes of Color-to-Gray Projection Operators
この記事では、カラー RGB イメージのグレースケールへの変換について、3 つのカラー チャネルを 1 つのカラー チャネルに投影するために使用される数学演算子の特徴を説明します。ほとんどの演算子は、256^3 色のそれぞれに 0 から 255 の範囲の単一のグレー レベルを割り当てるという事実に基づいて、色の母集団を明るさの増加する 256 のクラスターに分散するクラスタリング アルゴリズムです。オペレーターの作業方法を視覚化するために、クラスターのサイズと各クラスターの平均輝度がプロットされています。この作業で導入されたイコライゼーション モード (EQ) はクラスター サイズに焦点を当てていますが、輝度マッピング (BM) モードはクラスターごとの CIE L* 輝度分布を表します。 3 つのクラスの EQ モードと 2 つのクラスの BM モードが線形演算子で見つかり、6 つのクラスの分類法が定義されました。導入された理論的/方法論的フレームワークは、均等加重均一演算子、NTSC 標準演算子、および黒人の顔を明るくして現在の偏った分類器の顔認識を改善するために理想的に選択された演算子を考慮したケース スタディに適用されました。カラーからグレーへの変換の品質を評価するために使用される最新のメトリックは、2 つの BM モード クラスのいずれかをより適切に評価することがわかりましたが、人間のチームによって選択された理想的なオペレーターは、他のクラスに属します。したがって、これらの一般的なメトリックを特定の目的のカラーからグレーへの変換に使用しないように注意してください。このフレームワークを非線形オペレータに最終的に適用すると、新しいクラスの EQ および BM モードが発生する可能性があることに注意してください。この記事の主な貢献は、モデルの説明可能性が向上している現在の傾向の中で、機械学習に基づくものであっても、一般的なカラーからグレーへのコンバーターをよりよく理解するためのツールを提供することです。
In this article, the conversion of color RGB images to grayscale is covered by characterizing the mathematical operators used to project 3 color channels to a single one. Based on the fact that most operators assign each of the 256^3 colors a single gray level, ranging from 0 to 255, they are clustering algorithms that distribute the color population into 256 clusters of increasing brightness. To visualize the way operators work the sizes of the clusters and the average brightness of each cluster are plotted. The equalization mode (EQ) introduced in this work focuses on cluster sizes, while the brightness mapping (BM) mode describes the CIE L* luminance distribution per cluster. Three classes of EQ modes and two classes of BM modes were found in linear operators, defining a 6-class taxonomy. The theoretical/methodological framework introduced was applied in a case study considering the equal-weights uniform operator, the NTSC standard operator, and an operator chosen as ideal to lighten the faces of black people to improve facial recognition in current biased classifiers. It was found that most current metrics used to assess the quality of color-to-gray conversions better assess one of the two BM mode classes, but the ideal operator chosen by a human team belongs to the other class. Therefore, this cautions against using these general metrics for specific purpose color-to-gray conversions. It should be noted that eventual applications of this framework to non-linear operators can give rise to new classes of EQ and BM modes. The main contribution of this article is to provide a tool to better understand color to gray converters in general, even those based on machine learning, within the current trend of better explainability of models.
updated: Sun Aug 21 2022 19:23:06 GMT+0000 (UTC)
published: Sun Aug 21 2022 19:23:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト