機械学習の評価指標は、平均精度やF1スコアなど、微分不可能および分解不可能である可能性があるため、損失関数とは見なされないことがよくあります。このホワイトペーパーでは、評価指標を近似するためにディープニューラルネットワークを使用する代理損失学習を再検討することで、この問題に対処することを目的としています。深いニューラルネットワークを介して評価メトリックの正確な回復を追求する代わりに、これらの評価メトリックの存在の目的を思い出します。これは、あるモデルが別のモデルよりも優れているか悪いかを区別することです。本論文では、代理損失とメトリクス間のモデルの関係を直接維持することで十分であることを示し、この関係を最大化して代理損失を学習するための順位相関ベースの最適化手法を提案します。以前の作品と比較して、私たちの方法は最適化がはるかに簡単で、大幅な効率とパフォーマンスの向上を享受しています。広範な実験により、私たちの方法は、画像分類やニューラル機械翻訳などのさまざまなタスクの改善を達成し、人間の姿勢推定や機械読解タスクの最先端の方法よりも優れていることが示されています。コードはhttps://github.com/hunto/ReLossで入手できます。
Evaluation metrics in machine learning are often hardly taken as loss functions, as they could be non-differentiable and non-decomposable, e.g., average precision and F1 score. This paper aims to address this problem by revisiting the surrogate loss learning, where a deep neural network is employed to approximate the evaluation metrics. Instead of pursuing an exact recovery of the evaluation metric through a deep neural network, we are reminded of the purpose of the existence of these evaluation metrics, which is to distinguish whether one model is better or worse than another. In this paper, we show that directly maintaining the relation of models between surrogate losses and metrics suffices, and propose a rank correlation-based optimization method to maximize this relation and learn surrogate losses. Compared to previous works, our method is much easier to optimize and enjoys significant efficiency and performance gains. Extensive experiments show that our method achieves improvements on various tasks including image classification and neural machine translation, and even outperforms state-of-the-art methods on human pose estimation and machine reading comprehension tasks. Code is available at: https://github.com/hunto/ReLoss.