arXiv reaDer
SSL モデルには既視感がありますか?自己教師あり学習における意図しない暗記の事例
Do SSL Models Have Déjà Vu? A Case of Unintended Memorization in Self-supervised Learning
自己教師あり学習 (SSL) アルゴリズムは、自然画像のさまざまな部分を互いに関連付けることを学習することにより、有用な画像表現を生成できます。ただし、極端な場合、SSL モデルは、意味的に意味のある関連付けを学習するのではなく、個々のトレーニング サンプルの特定の部分を意図せずに記憶する可能性があります。この作業では、SSL モデルにおける画像固有の情報の意図しない記憶 (既視記憶と呼ばれる) について体系的な研究を行います。具体的には、トレーニング済みのモデルと、背景 (水、空、草など) のみを含むトレーニング画像のトリミングが与えられた場合、前景のオブジェクトを高精度で推測したり、視覚的に再構築したりできることを示します。さらに、既視感記憶はさまざまな SSL アルゴリズムに共通しており、特定の設計上の選択によって悪化し、表現品質を評価するための従来の手法では検出できないことを示しています。既視感の記憶に関する私たちの研究は、SSL モデルにおけるこれまで知られていなかったプライバシー リスクを明らかにし、潜在的な実用的な緩和戦略を示唆しています。コードは https://github.com/facebookresearch/DejaVu で入手できます。
Self-supervised learning (SSL) algorithms can produce useful image representations by learning to associate different parts of natural images with one another. However, when taken to the extreme, SSL models can unintendedly memorize specific parts in individual training samples rather than learning semantically meaningful associations. In this work, we perform a systematic study of the unintended memorization of image-specific information in SSL models -- which we refer to as déj\`a vu memorization. Concretely, we show that given the trained model and a crop of a training image containing only the background (e.g., water, sky, grass), it is possible to infer the foreground object with high accuracy or even visually reconstruct it. Furthermore, we show that déj\`a vu memorization is common to different SSL algorithms, is exacerbated by certain design choices, and cannot be detected by conventional techniques for evaluating representation quality. Our study of déj\`a vu memorization reveals previously unknown privacy risks in SSL models, as well as suggests potential practical mitigation strategies. Code is available at https://github.com/facebookresearch/DejaVu.
updated: Fri Apr 28 2023 15:14:30 GMT+0000 (UTC)
published: Wed Apr 26 2023 22:29:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト