Analysis of CNN-based remote-PPG to understand limitations and sensitivities
 畳み込みニューラルネットワーク(CNN)に基づくディープラーニングは、さまざまなビジョンベースのアプリケーション、最近ではカメラベースのバイタルサインモニタリングでも有望な結果を示しています。 CNNベースのフォトプレチスモグラフィ(PPG)抽出は、これまでのところ、理解よりもパフォーマンスに重点を置いてきました。このホワイトペーパーでは、この方法論の人気が高まるにつれて、この方法論の理解を向上させることを目的とした実験で4つの質問に答えようとします。ネットワークは、生理学的信号を抽出するために血液吸収変動を利用し、基準信号の選択とパラメータ(位相、スペクトル成分など)は予想よりも重要であると結論付けています。複数の畳み込みカーネルの可用性は、CNNが空間操作を通じて柔軟なチャネルの組み合わせに到達するために必要ですが、知識ベースのPPG抽出を使用したマルチサイト測定と同じモーションロバスト性を提供しない場合があります。最後に、PPG関連の事前知識は、CNNベースのPPG抽出に引き続き役立つと結論付けています。したがって、CNNベースのハイブリッド手法をさらに調査して、設計に事前知識を含めることをお勧めします。
Deep learning based on Convolutional Neural Network (CNN) has shown promising results in various vision-based applications, recently also in camera-based vital signs monitoring. The CNN-based Photoplethysmography (PPG) extraction has, so far, been focused on performance rather than understanding. In this paper, we try to answer four questions with experiments aiming at improving our understanding of this methodology as it gains popularity. We conclude that the network exploits the blood absorption variation to extract the physiological signals, and that the choice and parameters (phase, spectral content, etc.) of the reference-signal may be more critical than anticipated. The availability of multiple convolutional kernels is necessary for CNN to arrive at a flexible channel combination through the spatial operation, but may not provide the same motion-robustness as a multi-site measurement using knowledge-based PPG extraction. Finally, we conclude that the PPG-related prior knowledge is still helpful for the CNN-based PPG extraction. Consequently, we recommend further investigation of hybrid CNN-based methods to include prior knowledge in their design.
