arXiv reaDer
マルチドメイン画像から画像への翻訳のための注意蒸留による知識の伝達
Transferring Knowledge with Attention Distillation for Multi-Domain Image-to-Image Translation
勾配ベースの注意モデリングは、畳み込みニューラルネットワークを視覚化して理解する方法として広く使用されています。ただし、生成的敵対的ネットワーク(GAN)のトレーニング中にこれらの視覚的な説明を活用することは、コンピュータービジョン研究では未踏の領域です。実際、この種の情報は、GANのトレーニングに前向きな方法で影響を与えるために使用できると主張します。このため、この論文では、学生のアーキテクチャの結果を改善するために、マルチドメインの画像から画像への変換タスクの教師と学生のパラダイムで伝達される知識として、勾配ベースの注意をどのように使用できるかを示します。 。さらに、教師と生徒のネットワークがいくつかの類似点を共有する異なるドメインでトレーニングされている場合、トレーニング中に「疑似」注意をどのように使用できるかが示されます。このアプローチは、マルチドメインの顔の属性の転送と人間の表情の合成で検証され、定性的および定量的な結果の両方を示しています。
Gradient-based attention modeling has been used widely as a way to visualize and understand convolutional neural networks. However, exploiting these visual explanations during the training of generative adversarial networks (GANs) is an unexplored area in computer vision research. Indeed, we argue that this kind of information can be used to influence GANs training in a positive way. For this reason, in this paper, it is shown how gradient based attentions can be used as knowledge to be conveyed in a teacher-student paradigm for multi-domain image-to-image translation tasks in order to improve the results of the student architecture. Further, it is demonstrated how "pseudo"-attentions can also be employed during training when teacher and student networks are trained on different domains which share some similarities. The approach is validated on multi-domain facial attributes transfer and human expression synthesis showing both qualitative and quantitative results.
updated: Tue Aug 17 2021 06:47:04 GMT+0000 (UTC)
published: Tue Aug 17 2021 06:47:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト