近年、ディープ ニューラル ネットワークは画像分類タスクにおいて優れたパフォーマンスをもたらしています。しかし、データセットの複雑さの増大とパフォーマンスの向上への要求により、革新的な技術の探求が必要になっています。本研究は、空間的注意に基づく複数の位置特定を強化する新しいディープ ニューラル ネットワーク (T-Fusion Net と呼ばれる) を提案します。この注意メカニズムにより、ネットワークは関連する画像領域に焦点を当てることができ、識別力が向上します。前記ネットワークの均質なアンサンブルは、画像分類の精度を高めるためにさらに使用されます。アンサンブルに関して、提案されたアプローチでは、個々の T-Fusion Net の複数のインスタンスが考慮されます。このモデルには、個々のネットの出力をマージするファジー マックス フュージョンが組み込まれています。融合プロセスは、個々のモデルの寄与のバランスをとるために、慎重に選択されたパラメーターを通じて最適化されます。ベンチマーク Covid-19 (SARS-CoV-2 CT スキャン) データセットの実験評価により、提案された T-Fusion Net とそのアンサンブルの有効性が実証されました。提案された T-Fusion Net と均質アンサンブル モデルは、他の最先端の方法と比較して優れたパフォーマンスを示し、それぞれ 97.59% と 98.4% の精度を達成しました。
In recent years, deep neural networks are yielding better performance in image classification tasks. However, the increasing complexity of datasets and the demand for improved performance necessitate the exploration of innovative techniques. The present work proposes a new deep neural network (called as, T-Fusion Net) that augments multiple localizations based spatial attention. This attention mechanism allows the network to focus on relevant image regions, improving its discriminative power. A homogeneous ensemble of the said network is further used to enhance image classification accuracy. For ensembling, the proposed approach considers multiple instances of individual T-Fusion Net. The model incorporates fuzzy max fusion to merge the outputs of individual nets. The fusion process is optimized through a carefully chosen parameter to strike a balance on the contributions of the individual models. Experimental evaluations on benchmark Covid-19 (SARS-CoV-2 CT scan) dataset demonstrate the effectiveness of the proposed T-Fusion Net as well as its ensemble. The proposed T-Fusion Net and the homogeneous ensemble model exhibit better performance, as compared to other state-of-the-art methods, achieving accuracy of 97.59% and 98.4%, respectively.