arXiv reaDer
自然言語の監督から画像の不快感を推測する
Inferring Offensiveness In Images From Natural Language Supervision
事前にトレーニングされたモデルのプロービングまたは微調整(大規模)により、多くのNLPタスク、さらに最近では、画像データと組み合わせた場合のコンピュータービジョンタスクでも最先端のパフォーマンスが得られます。残念ながら、これらのアプローチには深刻なリスクも伴います。特に、Webから自動的に取得された大きな画像データセットには、カテゴリや不快な画像として蔑称的な用語が含まれている可能性があり、特定のクラスを過小評価している可能性もあります。したがって、データセットを注意深く文書化し、そのコンテンツをキュレートすることが急務となっています。残念ながら、このプロセスは面倒でエラーが発生しやすくなります。事前にトレーニングされたトランスフォーマー自体が、大規模なビジョンデータセットの自動キュレーションの方法論を提供することを示します。人間が注釈を付けた例とCLIPベースのモデルの暗黙知に基づいて、画像の不快感を評価するための関連するプロンプトを選択できることを示します。 ImageNetで以前に特定されたプライバシー侵害やポルノコンテンツなどに加えて、私たちのアプローチがさらに不適切で潜在的に不快なコンテンツを特定することを示します。
Probing or fine-tuning (large-scale) pre-trained models results in state-of-the-art performance for many NLP tasks and, more recently, even for computer vision tasks when combined with image data. Unfortunately, these approaches also entail severe risks. In particular, large image datasets automatically scraped from the web may contain derogatory terms as categories and offensive images, and may also underrepresent specific classes. Consequently, there is an urgent need to carefully document datasets and curate their content. Unfortunately, this process is tedious and error-prone. We show that pre-trained transformers themselves provide a methodology for the automated curation of large-scale vision datasets. Based on human-annotated examples and the implicit knowledge of a CLIP based model, we demonstrate that one can select relevant prompts for rating the offensiveness of an image. In addition to e.g. privacy violation and pornographic content previously identified in ImageNet, we demonstrate that our approach identifies further inappropriate and potentially offensive content.
updated: Fri Oct 08 2021 16:19:21 GMT+0000 (UTC)
published: Fri Oct 08 2021 16:19:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト