arXiv reaDer
カプセル間の動的ルーティング
Dynamic Routing Between Capsules
カプセルはニューロンのグループであり、その活動ベクトルは物体や物体部分などの特定のタイプの実体のインスタンス化パラメータを表している。このように、このように、ある特定のタイプのニューロンの活動ベクトルが、その実体が存在する確率を表すために、活動ベクトルの長さを使用し、その向きをインスタンス化パラメータを表すために使用する。あるレベルのアクティブカプセルは、変換行列を介して、より高いレベルのカプセルのインスタンス化パラメータの予測を行う。複数の予測が一致した場合、上位のカプセルがアクティブになる。本研究では、識別的に訓練された多層カプセルシステムがMNIST上で最先端の性能を達成し、高度に重複する桁の認識において畳み込みネットよりも格段に優れていることを示す。これらの結果を達成するために、我々は反復的なルーティング・バイ・アグリーメント機構を用いている。低レベルのカプセルは、活動ベクトルが大きなスカラー積を持つ高レベルのカプセルに出力を送ることを好むが、予測は低レベルのカプセルから送られる。
A capsule is a group of neurons whose activity vector represents the instantiation parameters of a specific type of entity such as an object or an object part. We use the length of the activity vector to represent the probability that the entity exists and its orientation to represent the instantiation parameters. Active capsules at one level make predictions, via transformation matrices, for the instantiation parameters of higher-level capsules. When multiple predictions agree, a higher level capsule becomes active. We show that a discrimininatively trained, multi-layer capsule system achieves state-of-the-art performance on MNIST and is considerably better than a convolutional net at recognizing highly overlapping digits. To achieve these results we use an iterative routing-by-agreement mechanism: A lower-level capsule prefers to send its output to higher level capsules whose activity vectors have a big scalar product with the prediction coming from the lower-level capsule.
updated: Tue Nov 07 2017 19:26:38 GMT+0000 (UTC)
published: Thu Oct 26 2017 17:49:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト