arXiv reaDer
言語モデルは、根拠なしに知覚構造をエンコードできますか?カラーのケーススタディ
Can Language Models Encode Perceptual Structure Without Grounding? A Case Study in Color
事前にトレーニングされた言語モデルは、エンティティ間の関係や知識ベースの概念などの関係情報をエンコードすることが示されています-(パリ、首都、フランス)。ただし、このタイプの単純な関係はヒューリスティックに復元できることが多く、知覚構造など、モデルが世界に根ざした位相構造を暗黙的に反映する程度は不明です。この質問を調査するために、色に関する徹底的なケーススタディを実施します。つまり、知覚的に意味のある距離メトリックを持つ色空間であるCIELABで表される単色の色の用語とカラーチップのデータセットを使用します。この空間の色の構造アラインメントをテキストから派生した色名表現で評価する2つの方法を使用して、重要な対応を見つけます。色スペクトル全体の整列の違いを分析すると、平均して、暖かい色は冷たい色よりも知覚色空間によりよく整列していることがわかり、色の命名における効率的なコミュニケーションに関する最近の研究からの発見との興味深いつながりを示唆しています。さらなる分析は、アラインメントの違いが、部分的には、コロケーション性と構文上の使用法の違いによって媒介されることを示唆しており、色の知覚と使用法および文脈との関係について疑問を投げかけています。
Pretrained language models have been shown to encode relational information, such as the relations between entities or concepts in knowledge-bases -- (Paris, Capital, France). However, simple relations of this type can often be recovered heuristically and the extent to which models implicitly reflect topological structure that is grounded in world, such as perceptual structure, is unknown. To explore this question, we conduct a thorough case study on color. Namely, we employ a dataset of monolexemic color terms and color chips represented in CIELAB, a color space with a perceptually meaningful distance metric. Using two methods of evaluating the structural alignment of colors in this space with text-derived color term representations, we find significant correspondence. Analyzing the differences in alignment across the color spectrum, we find that warmer colors are, on average, better aligned to the perceptual color space than cooler ones, suggesting an intriguing connection to findings from recent work on efficient communication in color naming. Further analysis suggests that differences in alignment are, in part, mediated by collocationality and differences in syntactic usage, posing questions as to the relationship between color perception and usage and context.
updated: Tue Sep 14 2021 07:10:41 GMT+0000 (UTC)
published: Mon Sep 13 2021 17:09:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト