分類性能を高めるための正規化機能を組み込む機能としてトリプレット損失を採用しています。 ResNetやInceptionなどの標準アーキテクチャは、最小限のハイパーパラメーターチューニングで両方の損失をサポートするように拡張されています。これにより、事前トレーニングされたネットワークを微調整しながら、一般性が促進されます。三重項損失は、最近提案された埋め込み正規化器の強力な代理です。ただし、大きなバッチサイズ要件と高い計算コストのために回避されます。実験を通して、これらの仮定を再評価します。推論中、ネットワークは計算オーバーヘッドなしで分類タスクと埋め込みタスクの両方をサポートします。定量的評価は、5つのきめの細かい認識データセットの着実な改善を強調しています。不均衡なビデオデータセットをさらに評価すると、大幅に改善されます。三重項損失は、分類モデルの最近傍のような特徴埋め込み特性をもたらします。コードはhttp://bit.ly/2LNYEqLで入手できます。
We employ triplet loss as a feature embedding regularizer to boost classification performance. Standard architectures, like ResNet and Inception, are extended to support both losses with minimal hyper-parameter tuning. This promotes generality while fine-tuning pretrained networks. Triplet loss is a powerful surrogate for recently proposed embedding regularizers. Yet, it is avoided due to large batch-size requirement and high computational cost. Through our experiments, we re-assess these assumptions. During inference, our network supports both classification and embedding tasks without any computational overhead. Quantitative evaluation highlights a steady improvement on five fine-grained recognition datasets. Further evaluation on an imbalanced video dataset achieves significant improvement. Triplet loss brings feature embedding characteristics like nearest neighbor to classification models. Code available at http://bit.ly/2LNYEqL.