arXiv reaDer
画像多様体とその応用の確率論的および意味論的記述
Probabilistic and Semantic Descriptions of Image Manifolds and Their Applications
この論文は、画像の確率密度関数を推定する方法の説明から始まります。これは、そのようなデータは通常、高次元画像空間の制限された領域に存在するように制約されており、すべてのピクセル パターンが画像であるわけではないという観察を反映しています。画像は高次元空間の低次元多様体上にあるとよく言われます。ただし、このような低次元多様体上に画像が存在する可能性はありますが、多様体上のすべての点が画像である確率が等しいわけではありません。画像は多様体上に不均一に分布しています。私たちの課題は、この分布を確率分布としてモデル化する方法を考案することです。この目標を追求するにあたり、AI およびコンピューター ビジョン コミュニティで人気のある生成モデルを検討します。私たちの目的のために、生成/確率モデルは、1) サンプル生成: モデル化された密度関数に従ってこの分布からサンプリングできる必要があります、および 2) 確率計算: 対象のデータセットからこれまでに見たことのないサンプルが与えられるという特性を持つ必要があります。 、少なくとも正規化定数まではサンプルの確率を計算できるはずです。この目的を達成するために、流れモデルや拡散モデルを正規化するなどの方法の使用を調査します。次に、そのような確率的記述を使用して、敵対的な攻撃に対する防御を構築できることを示します。密度の観点から多様体を記述することに加えて、多様体上の点を記述するために意味論的解釈をどのように使用できるかについても検討します。この目的を達成するために、変分エンコーダを利用して、与えられた多様体上に存在する点のもつれのない表現を生成する創発言語フレームワークを検討します。多様体上の点間の軌跡は、進化する意味論的記述の観点から記述することができます。
This paper begins with a description of methods for estimating probability density functions for images that reflects the observation that such data is usually constrained to lie in restricted regions of the high-dimensional image space - not every pattern of pixels is an image. It is common to say that images lie on a lower-dimensional manifold in the high-dimensional space. However, although images may lie on such lower-dimensional manifolds, it is not the case that all points on the manifold have an equal probability of being images. Images are unevenly distributed on the manifold, and our task is to devise ways to model this distribution as a probability distribution. In pursuing this goal, we consider generative models that are popular in AI and computer vision community. For our purposes, generative/probabilistic models should have the properties of 1) sample generation: it should be possible to sample from this distribution according to the modelled density function, and 2) probability computation: given a previously unseen sample from the dataset of interest, one should be able to compute the probability of the sample, at least up to a normalising constant. To this end, we investigate the use of methods such as normalising flow and diffusion models. We then show that such probabilistic descriptions can be used to construct defences against adversarial attacks. In addition to describing the manifold in terms of density, we also consider how semantic interpretations can be used to describe points on the manifold. To this end, we consider an emergent language framework which makes use of variational encoders to produce a disentangled representation of points that reside on a given manifold. Trajectories between points on a manifold can then be described in terms of evolving semantic descriptions.
updated: Thu Jul 06 2023 09:36:45 GMT+0000 (UTC)
published: Thu Jul 06 2023 09:36:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト