畳み込みニューラルネットワーク(CNN)は、自動疾患診断のための既存の医療システムを進歩させてきました。ただし、これらのシステムに対する脅威は、敵対的な攻撃によってCNNが脆弱になるという脅威が発生します。不正確な診断結果は、人間の医療に悪影響を及ぼします。深い医療診断システムを強化するために、潜在的な敵対的攻撃を調査する必要があります。一方、医用画像(CT、眼底、内視鏡画像など)にはいくつかのモダリティがあり、それぞれのタイプが他のタイプとは大幅に異なります。さまざまなタイプの医用画像に対して敵対的な摂動を生成することは、より困難です。本論文では、医用画像上で敵対的摂動を一貫して生成するための画像ベースの医学的敵対的攻撃法を提案する。この方法の目的関数は、損失偏差項と損失安定化項で構成されます。損失偏差項は、敵対的な例のCNN予測とそのグラウンドトゥルースラベルの間の相違を増加させます。一方、損失安定化項は、この例とその平滑化された入力の同様のCNN予測を保証します。摂動生成の反復全体の観点から、提案された損失安定化項は、摂動空間を徹底的に検索して、局所的な最適脱出のために単一のスポットを平滑化します。提案された損失関数のKL発散をさらに分析し、損失安定化項が、グラウンドトゥルースから逸脱しながら、摂動を固定された目的のスポットに向けて更新することを発見します。この安定化により、提案された医療攻撃がさまざまなタイプの医用画像に効果的になり、小さな分散で摂動が生成されます。最近のCOVID-19データセットを含むいくつかの医療画像分析ベンチマークでの実験は、提案された方法の安定性を示しています。
Convolutional Neural Networks (CNNs) have advanced existing medical systems for automatic disease diagnosis. However, a threat to these systems arises that adversarial attacks make CNNs vulnerable. Inaccurate diagnosis results make a negative influence on human healthcare. There is a need to investigate potential adversarial attacks to robustify deep medical diagnosis systems. On the other side, there are several modalities of medical images (e.g., CT, fundus, and endoscopic image) of which each type is significantly different from others. It is more challenging to generate adversarial perturbations for different types of medical images. In this paper, we propose an image-based medical adversarial attack method to consistently produce adversarial perturbations on medical images. The objective function of our method consists of a loss deviation term and a loss stabilization term. The loss deviation term increases the divergence between the CNN prediction of an adversarial example and its ground truth label. Meanwhile, the loss stabilization term ensures similar CNN predictions of this example and its smoothed input. From the perspective of the whole iterations for perturbation generation, the proposed loss stabilization term exhaustively searches the perturbation space to smooth the single spot for local optimum escape. We further analyze the KL-divergence of the proposed loss function and find that the loss stabilization term makes the perturbations updated towards a fixed objective spot while deviating from the ground truth. This stabilization ensures the proposed medical attack effective for different types of medical images while producing perturbations in small variance. Experiments on several medical image analysis benchmarks including the recent COVID-19 dataset show the stability of the proposed method.