過去10年間で、畳み込みニューラルネットワーク(CNN)は、ほとんどのコンピュータービジョンタスクの深層学習アーキテクチャの基盤を形成してきました。ただし、必ずしも最適であるとは限りません。たとえば、数学的形態学は、バイナリ画像を処理するのにより適していることが知られています。この作業では、バイナリ入力と出力を処理する形態学的ニューラルネットワークを作成します。 CNNに触発された構造を提案し、畳み込みを侵食と膨張に置き換えることで、このような画像に適合したレイヤーを作成します。結果として得られた学習ネットワークが実際に形態学的演算子であるかどうかについて、説明可能な理論的結果を示します。基本的な二項演算子を学習するために設計された有望な実験結果を提示し、コードをオンラインで公開しました。
In the last ten years, Convolutional Neural Networks (CNNs) have formed the basis of deep-learning architectures for most computer vision tasks. However, they are not necessarily optimal. For example, mathematical morphology is known to be better suited to deal with binary images. In this work, we create a morphological neural network that handles binary inputs and outputs. We propose their construction inspired by CNNs to formulate layers adapted to such images by replacing convolutions with erosions and dilations. We give explainable theoretical results on whether or not the resulting learned networks are indeed morphological operators. We present promising experimental results designed to learn basic binary operators, and we have made our code publicly available online.