ディープ ラーニングは人間社会に革命をもたらしましたが、ディープ ニューラル ネットワークのブラック ボックスの性質は、信頼性が要求される業界へのさらなる適用を妨げています。それらを解き明かそうとする試みの中で、多くの作品は内部変数を観察または影響を与えて、モデルの理解可能性と透明性を改善しています。ただし、既存の方法は直感的な仮定に依存しており、数学的保証がありません。このギャップを埋めるために、モデルの理解可能性と透明性の十分な条件から導き出された、モデル パラメーターに対する有界性と直交性の制約により、モデルの説明可能性を改善するためのオプティマイザーである Bort を紹介します。 Bort によって最適化されたモデル表現で再構成とバックトラッキングを実行し、モデルの説明可能性の明らかな改善を観察します。 Bort に基づいて、追加のパラメーターやトレーニングなしで、説明可能な敵対的サンプルを合成できます。驚くべきことに、ResNet や MNIST 上の DeiT、CIFAR-10、ImageNet など、さまざまなアーキテクチャの分類精度が Bort によって常に向上していることがわかります。
Deep learning has revolutionized human society, yet the black-box nature of deep neural networks hinders further application to reliability-demanded industries. In the attempt to unpack them, many works observe or impact internal variables to improve the model's comprehensibility and transparency. However, existing methods rely on intuitive assumptions and lack mathematical guarantees. To bridge this gap, we introduce Bort, an optimizer for improving model explainability with boundedness and orthogonality constraints on model parameters, derived from the sufficient conditions of model comprehensibility and transparency. We perform reconstruction and backtracking on the model representations optimized by Bort and observe an evident improvement in model explainability. Based on Bort, we are able to synthesize explainable adversarial samples without additional parameters and training. Surprisingly, we find Bort constantly improves the classification accuracy of various architectures including ResNet and DeiT on MNIST, CIFAR-10, and ImageNet.