arXiv reaDer
変換不変最適化に基づくコンピュータビジョンの解釈に向けて
Towards interpreting computer vision based on transformation invariant optimization
ディープニューラルネットワーク(DNN)がどのように予測を行うかを解釈することは、人工知能の重要な分野であり、DNNの幅広いアプリケーションを妨げます。学習した表現の視覚化は、人間がDNNのビジョンを理解するのに役立ちます。この作業では、ニューラルネットワークをターゲットクラスにアクティブ化できる視覚化された画像が、バックプロパゲーション法によって生成されます。ここでは、回転およびスケーリング操作を適用して、画像生成プロセスに変換の不変性を導入します。これにより、視覚化効果が大幅に向上します。最後に、そのような方法がニューラルネットワークへの洞察を得るのに役立つ可能性があるいくつかのケースを示します。
Interpreting how does deep neural networks (DNNs) make predictions is a vital field in artificial intelligence, which hinders wide applications of DNNs. Visualization of learned representations helps we humans understand the vision of DNNs. In this work, visualized images that can activate the neural network to the target classes are generated by back-propagation method. Here, rotation and scaling operations are applied to introduce the transformation invariance in the image generating process, which we find a significant improvement on visualization effect. Finally, we show some cases that such method can help us to gain insight into neural networks.
updated: Fri Jun 18 2021 08:04:10 GMT+0000 (UTC)
published: Fri Jun 18 2021 08:04:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト