arXiv reaDer
Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization
 粒度の細かい視覚分類(FGVC)は、変形、オクルージョン、照明などに起因するクラス内の高分散とクラス間の低分散のため、重要ですが困難なタスクです。これらの問題に対処するために、注意畳み込みバイナリニューラルツリーアーキテクチャが提示されます弱く監督されたFGVCの場合。具体的には、ツリー構造のエッジに沿って畳み込み演算を組み込み、各ノードのルーティング関数を使用して、ツリー内のルートからリーフへの計算パスを決定します。最終決定は、リーフノードからの予測の合計として計算されます。深い畳み込み演算は、オブジェクトの表現をキャプチャすることを学習し、ツリー構造は、粗いものから細かいものまでの階層的特徴学習プロセスを特徴づけます。さらに、アテンショントランスフォーマモジュールを使用して、差別的な機能をキャプチャするようにネットワークを強制します。負の対数尤度損失は、バックプロパゲーションを使用したSGDによってエンドツーエンドの方法でネットワーク全体をトレーニングするために使用されます。 CUB-200-2011、Stanford CarsおよびAircraftのデータセットに関するいくつかの実験は、提案された方法が最新技術に対して良好に機能することを示しています。
Fine-grained visual categorization (FGVC) is an important but challenging task due to high intra-class variances and low inter-class variances caused by deformation, occlusion, illumination, etc. An attention convolutional binary neural tree architecture is presented to address those problems for weakly supervised FGVC. Specifically, we incorporate convolutional operations along edges of the tree structure, and use the routing functions in each node to determine the root-to-leaf computational paths within the tree. The final decision is computed as the summation of the predictions from leaf nodes. The deep convolutional operations learn to capture the representations of objects, and the tree structure characterizes the coarse-to-fine hierarchical feature learning process. In addition, we use the attention transformer module to enforce the network to capture discriminative features. The negative log-likelihood loss is used to train the entire network in an end-to-end fashion by SGD with back-propagation. Several experiments on the CUB-200-2011, Stanford Cars and Aircraft datasets demonstrate that the proposed method performs favorably against the state-of-the-arts.
updated: Sat Mar 14 2020 04:59:49 GMT+0000 (UTC)
published: Wed Sep 25 2019 10:03:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト