畳み込みニューラル ネットワーク (CNN) は最近、2D 心臓超音波画像をセグメント化する優れた能力を証明しました。ただし、心臓超音波ビデオのフルシーケンス セグメンテーションを実行しようとする試みの大部分は、キーフレーム画像のみでトレーニングされたモデルに依存するか、時間の経過とともにトポロジを維持できません。これらの問題に対処するために、この研究では、超音波ビデオのセグメンテーションを位置合わせ推定問題として考慮し、神経常微分方程式 (Neural ODE) を使用した微分同相画像位置合わせのための新しい方法を提示します。特に、フレーム間の登録フィールド ベクトル場を連続軌跡 ODE として考慮します。次に、推定された登録フィールドが最初のフレームのセグメンテーション マスクに適用されて、心周期全体のセグメントが取得されます。提案された方法である Echo-ODE には、以前の最先端技術と比較していくつかの重要な改善が導入されています。まず、連続 ODE を解くことにより、提案された方法は、シーケンス全体にわたってセグメンテーション マップのトポロジーを維持しながら、よりスムーズなセグメンテーションを実現します (ハウスドルフ距離: 3.7-4.4)。次に、時間的一貫性属性を明示的に最適化することなく、フレーム間の時間的一貫性を維持し、データセット内のビデオの 91% で時間的一貫性を実現します。最後に、提案された方法は、セグメンテーション マップの臨床精度 (LVEF の MAE: 2.7 ~ 3.1) を維持できます。結果は、私たちの方法がさまざまな側面で以前の最先端技術を上回っていることを示しており、医療画像アプリケーションにおけるニューラル ODE の実装における時空間データ処理の重要性を示しています。これらの発見は、心エコー検査のセグメンテーションタスクを解決するための新しい研究の方向性を切り開きます。
Convolutional neural networks (CNNs) have recently proven their excellent ability to segment 2D cardiac ultrasound images. However, the majority of attempts to perform full-sequence segmentation of cardiac ultrasound videos either rely on models trained only on keyframe images or fail to maintain the topology over time. To address these issues, in this work, we consider segmentation of ultrasound video as a registration estimation problem and present a novel method for diffeomorphic image registration using neural ordinary differential equations (Neural ODE). In particular, we consider the registration field vector field between frames as a continuous trajectory ODE. The estimated registration field is then applied to the segmentation mask of the first frame to obtain a segment for the whole cardiac cycle. The proposed method, Echo-ODE, introduces several key improvements compared to the previous state-of-the-art. Firstly, by solving a continuous ODE, the proposed method achieves smoother segmentation, preserving the topology of segmentation maps over the whole sequence (Hausdorff distance: 3.7-4.4). Secondly, it maintains temporal consistency between frames without explicitly optimizing for temporal consistency attributes, achieving temporal consistency in 91% of the videos in the dataset. Lastly, the proposed method is able to maintain the clinical accuracy of the segmentation maps (MAE of the LVEF: 2.7-3.1). The results show that our method surpasses the previous state-of-the-art in multiple aspects, demonstrating the importance of spatial-temporal data processing for the implementation of Neural ODEs in medical imaging applications. These findings open up new research directions for solving echocardiography segmentation tasks.