画像分類用の深層学習モデルは、多くの場合、歴史と効率の理由から 224 x 224 ピクセルの解像度でトレーニングされます。ただし、胸部 X 線写真は、微妙な病状を表示するためにはるかに高い解像度で取得されます。この研究では、胸部 X 線 14 データセットを使用して、胸部 X 線分類パフォーマンスに対するトレーニング解像度の影響を調査します。結果は、より高い画像解像度、具体的には 1024 x 1024 ピクセルでトレーニングすると、平均 AUC が 84.2 % となり、256 x 256 ピクセルの画像でトレーニングした場合の 82.7 % と比較して、全体的な分類パフォーマンスが最高になることが示されています。さらに、境界ボックスと GradCAM 顕著性マップの比較は、256 x 256 ピクセルなどの低解像度では小さな病状を識別するには不十分であり、モデルに偽の識別特徴の使用を強いることを示唆しています。私たちのコードは https://gitlab.lrz.de/IP/cxr-resolution で公開されています。
Deep learning models for image classification are often trained at a resolution of 224 x 224 pixels for historical and efficiency reasons. However, chest X-rays are acquired at a much higher resolution to display subtle pathologies. This study investigates the effect of training resolution on chest X-ray classification performance, using the chest X-ray 14 dataset. The results show that training with a higher image resolution, specifically 1024 x 1024 pixels, results in the best overall classification performance with a mean AUC of 84.2 % compared to 82.7 % when trained with 256 x 256 pixel images. Additionally, comparison of bounding boxes and GradCAM saliency maps suggest that low resolutions, such as 256 x 256 pixels, are insufficient for identifying small pathologies and force the model to use spurious discriminating features. Our code is publicly available at https://gitlab.lrz.de/IP/cxr-resolution