Active Contour Model(ACM)は標準的な画像解析手法であり、その多数のバリエーションが複数の分野で膨大な研究の注目を集めています。しかし、誤って、ACMの微分方程式ベースの定式化とユーザー初期化へのプロトタイプ依存性は、画像セグメンテーションに対する最近人気のあるディープラーニングアプローチとほとんど互換性がないと見なされています。このペーパーでは、これら2つのパラダイムの最初の緊密な統合を紹介します。特に、Deep Convolutional Active Contours(DCAC)を考案しました。これは、Convolutional Neural Network(CNN)と学習可能なパラメーターを備えたACMで構成される、真にエンドツーエンドのトレーニング可能な画像セグメンテーションフレームワークです。 ACMのオイラーエネルギー関数には、ACMを初期化するバックボーンCNNによって予測されるピクセルごとのパラメーターマップが含まれています。重要なのは、CNNとACMの両方のコンポーネントがTensorFlowに完全に実装されており、DCACアーキテクチャ全体がエンドツーエンドで自動的に微分可能であり、ユーザーの介入なしにバックプロパゲーションのトレーニングが可能なことです。困難なテストケースとして、航空写真でインスタンスのセグメンテーションを構築する問題に取り組み、2つの公開されているデータセットVaihingenとBing HutsでDCACを評価します。当社の結果は、建物のセグメンテーションのために、DCACが新しい最先端のパフォーマンスを大幅に確立することを示しています。
The Active Contour Model (ACM) is a standard image analysis technique whose numerous variants have attracted an enormous amount of research attention across multiple fields. Incorrectly, however, the ACM's differential-equation-based formulation and prototypical dependence on user initialization have been regarded as being largely incompatible with the recently popular deep learning approaches to image segmentation. This paper introduces the first tight unification of these two paradigms. In particular, we devise Deep Convolutional Active Contours (DCAC), a truly end-to-end trainable image segmentation framework comprising a Convolutional Neural Network (CNN) and an ACM with learnable parameters. The ACM's Eulerian energy functional includes per-pixel parameter maps predicted by the backbone CNN, which also initializes the ACM. Importantly, both the CNN and ACM components are fully implemented in TensorFlow, and the entire DCAC architecture is end-to-end automatically differentiable and backpropagation trainable without user intervention. As a challenging test case, we tackle the problem of building instance segmentation in aerial images and evaluate DCAC on two publicly available datasets, Vaihingen and Bing Huts. Our reseults demonstrate that, for building segmentation, the DCAC establishes a new state-of-the-art performance by a wide margin.