arXiv reaDer
アートの形式的分析:言語モデルによるスタイルからのビジュアルコンセプトのプロキシ学習
Formal Analysis of Art: Proxy Learning of Visual Concepts from Style Through Language Models
一連の視覚要素と芸術の原則を使用して美術絵画を定量化できる機械学習システムを紹介します。この正式な分析は芸術を理解するための基本ですが、そのようなシステムを開発することは困難です。絵画は視覚的に複雑ですが、直接ラベルを使用して十分なトレーニングデータを収集することも困難です。これらの実際的な制限を解決するために、プロキシ学習と呼ばれる新しいメカニズムを導入します。これは、スタイルとの一般的な関係を通じて絵画の視覚的概念を学習します。このフレームワークは視覚的な注釈を必要としませんが、スタイルラベルと視覚的な概念とスタイルの間の一般的な関係のみを使用します。この論文では、新しいプロキシモデルを提案し、プロキシ学習のコンテキストで4つの既存の方法を再定式化します。定量的および定性的な比較を通じて、これらの方法を評価し、芸術的な視覚的概念の定量化におけるそれらの有効性を比較します。ここで、一般的な関係は言語モデルによって推定されます。 GloVeまたはBERT。言語モデリングは、ラベル付けを必要としない実用的でスケーラブルなソリューションですが、必然的に不完全です。新しいプロキシモデルが不完全性に対してどのように堅牢であるかを示しますが、他のモデルはそれによって敏感に影響を受けます。
We present a machine learning system that can quantify fine art paintings with a set of visual elements and principles of art. This formal analysis is fundamental for understanding art, but developing such a system is challenging. Paintings have high visual complexities, but it is also difficult to collect enough training data with direct labels. To resolve these practical limitations, we introduce a novel mechanism, called proxy learning, which learns visual concepts in paintings though their general relation to styles. This framework does not require any visual annotation, but only uses style labels and a general relationship between visual concepts and style. In this paper, we propose a novel proxy model and reformulate four pre-existing methods in the context of proxy learning. Through quantitative and qualitative comparison, we evaluate these methods and compare their effectiveness in quantifying the artistic visual concepts, where the general relationship is estimated by language models; GloVe or BERT. The language modeling is a practical and scalable solution requiring no labeling, but it is inevitably imperfect. We demonstrate how the new proxy model is robust to the imperfection, while the other models are sensitively affected by it.
updated: Wed Jan 05 2022 21:03:29 GMT+0000 (UTC)
published: Wed Jan 05 2022 21:03:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト