Text-to-Image モデルには、展開への適合性が制限される可能性があるさまざまな安全性の問題があります。これまでの方法では、テキストから画像へのモデルにおけるバイアス、著作権、不快なコンテンツの個別の問題に個別に対処していました。ただし、現実の世界では、これらすべての問題が同じモデルに同時に現れます。単一のアプローチですべての問題に対処する方法を紹介します。私たちの手法である統合コンセプト編集 (UCE) は、閉じた形式のソリューションを使用してトレーニングせずにモデルを編集し、テキスト条件付き拡散モデルの同時編集にシームレスに拡張します。我々は、テキストから画像への投影を編集することによる、スケーラブルな同時バイアス除去、スタイル消去、コンテンツモデレーションを実証し、以前の研究に比べて改善された有効性とスケーラビリティを実証する広範な実験を紹介します。コードは https://unified.baulab.info で入手できます。
Text-to-image models suffer from various safety issues that may limit their suitability for deployment. Previous methods have separately addressed individual issues of bias, copyright, and offensive content in text-to-image models. However, in the real world, all of these issues appear simultaneously in the same model. We present a method that tackles all issues with a single approach. Our method, Unified Concept Editing (UCE), edits the model without training using a closed-form solution, and scales seamlessly to concurrent edits on text-conditional diffusion models. We demonstrate scalable simultaneous debiasing, style erasure, and content moderation by editing text-to-image projections, and we present extensive experiments demonstrating improved efficacy and scalability over prior work. Our code is available at https://unified.baulab.info