ディープラーニングにより、画像セグメンテーションでの手動による特徴選択の必要性が大幅に削減されました。それでも、ネットワークアーキテクチャの最適化とハイパーパラメーターの調整は、ほとんどが手動で時間がかかります。コンピュータビジョンでのネットワークアーキテクチャ検索に関する研究努力は増えていますが、ほとんどの研究はセグメンテーションではなく画像分類に集中しており、特に3Dでの医療画像セグメンテーションに関する努力は非常に限られています。これを改善するために、3D画像セグメンテーションのネットワークアーキテクチャ検索用のフレームワークSegNAS3Dを提案します。このフレームワークでは、ネットワークアーキテクチャは、畳み込みやスキップ接続などの操作で構成される相互接続されたビルディングブロックで構成されます。ブロック構造を学習可能な有向非巡回グラフとして表現することにより、特徴チャネルの数や、ディープスーパービジョンを使用するオプションなどのハイパーパラメーターを、微分のないグローバル最適化を通じて一緒に学習できます。 19の構造を持つ43の3D脳磁気共鳴画像の実験では、平均ダイス係数が82%に達しました。各アーキテクチャの検索に必要なのは3つのGPUで3日未満で、手動で作成された最新のアーキテクチャよりもはるかに小さいアーキテクチャを作成しました。
Deep learning has largely reduced the need for manual feature selection in image segmentation. Nevertheless, network architecture optimization and hyperparameter tuning are mostly manual and time consuming. Although there are increasing research efforts on network architecture search in computer vision, most works concentrate on image classification but not segmentation, and there are very limited efforts on medical image segmentation especially in 3D. To remedy this, here we propose a framework, SegNAS3D, for network architecture search of 3D image segmentation. In this framework, a network architecture comprises interconnected building blocks that consist of operations such as convolution and skip connection. By representing the block structure as a learnable directed acyclic graph, hyperparameters such as the number of feature channels and the option of using deep supervision can be learned together through derivative-free global optimization. Experiments on 43 3D brain magnetic resonance images with 19 structures achieved an average Dice coefficient of 82%. Each architecture search required less than three days on three GPUs and produced architectures that were much smaller than the state-of-the-art manually created architectures.