arXiv reaDer
きめ細かいオブジェクト分類のための知識伝達グラフを使用したディープアンサンブル協調学習
Deep Ensemble Collaborative Learning by using Knowledge-transfer Graph for Fine-grained Object Classification
複数のネットワークが知識を共有して学習する相互学習により、各ネットワークのパフォーマンスが向上します。ただし、相互学習を行ったネットワークのアンサンブルのパフォーマンスは、各ネットワークのパフォーマンスが大幅に向上したとしても、相互学習のない通常のアンサンブルのパフォーマンスを大幅に向上させることはありません。これは、相互学習の知識とアンサンブルのネットワークの個性との関係が原因である可能性があります。本研究では、相互学習におけるネットワーク間の多様性を促進する損失設計を導入することにより、知識伝達を使用してアンサンブルの精度を向上させるアンサンブル手法を提案します。アテンションマップを知識として使用します。これは、ネットワークの中間層における確率分布と情報を表します。知識移転方法のためにネットワークと損失設計を組み合わせる方法はたくさんあります。したがって、知識伝達グラフの自動最適化を使用して、従来の相互学習および蒸留方法をグラフィカルに表現し、ハイパーパラメータ検索を通じて各要素を最適化することにより、さまざまな知識伝達方法を検討します。提案手法は、知識伝達グラフにアンサンブルを構築するメカニズム、注意喪失、ネットワーク間の多様性を促進する喪失設計からなる。アンサンブルの精度を最大化するために知識伝達グラフを最適化することにより、最適なアンサンブル学習を探索します。 Stanford Dogs、Stanford Cars、およびCUB-200-2011のデータセットを使用したグラフの調査と評価実験から、提案された方法が従来のアンサンブル方法よりも正確であることを確認します。
Mutual learning, in which multiple networks learn by sharing their knowledge, improves the performance of each network. However, the performance of ensembles of networks that have undergone mutual learning does not improve significantly from that of normal ensembles without mutual learning, even though the performance of each network has improved significantly. This may be due to the relationship between the knowledge in mutual learning and the individuality of the networks in the ensemble. In this study, we propose an ensemble method using knowledge transfer to improve the accuracy of ensembles by introducing a loss design that promotes diversity among networks in mutual learning. We use an attention map as knowledge, which represents the probability distribution and information in the middle layer of a network. There are many ways to combine networks and loss designs for knowledge transfer methods. Therefore, we use the automatic optimization of knowledge-transfer graphs to consider a variety of knowledge-transfer methods by graphically representing conventional mutual-learning and distillation methods and optimizing each element through hyperparameter search. The proposed method consists of a mechanism for constructing an ensemble in a knowledge-transfer graph, attention loss, and a loss design that promotes diversity among networks. We explore optimal ensemble learning by optimizing a knowledge-transfer graph to maximize ensemble accuracy. From exploration of graphs and evaluation experiments using the datasets of Stanford Dogs, Stanford Cars, and CUB-200-2011, we confirm that the proposed method is more accurate than a conventional ensemble method.
updated: Sat Mar 27 2021 08:56:00 GMT+0000 (UTC)
published: Sat Mar 27 2021 08:56:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト