arXiv reaDer
EBJR:適応推論のためのエネルギーベースの共同推論
EBJR: Energy-Based Joint Reasoning for Adaptive Inference
最先端の深層学習モデルは、さまざまなベンチマークで重要なパフォーマンスレベルを達成しています。ただし、優れたパフォーマンスには、非効率的な計算コストが伴います。一方、軽量アーキテクチャは中程度の精度を実現しますが、はるかに望ましいレイテンシーを実現します。この論文は、大きな正確なモデルを小さな速いモデルと一緒に使用する新しい方法を提示します。この目的のために、我々は、浅いモデルと深いモデルの間でサンプルを適応的に分配して、深いモデルに近い精度を達成するが、浅いモデルに近い待ち時間を達成するエネルギーベースのジョイント推論(EBJR)フレームワークを提案する。私たちの方法は、アーキテクチャの変更や再トレーニングを必要としないため、すぐに使用できる事前トレーニング済みモデルに適用できます。さらに、特にクラウドサービスの場合、使用と展開が簡単です。さまざまなダウンストリームタスクに関する包括的な一連の実験を通じて、私たちの方法がかなりのマージンを持って強力な最先端のアプローチよりも優れていることを示しています。さらに、特殊なEBJRを提案します。これは、ターゲットタスクを部分的にのみ実行するが、さらに高い精度と高速な推論を実現する、より小さな特殊なサイドモデルを作成する方法の拡張です。理論的評価と実験的評価の両方を使用して、メソッドの長所を検証します。
State-of-the-art deep learning models have achieved significant performance levels on various benchmarks. However, the excellent performance comes at a cost of inefficient computational cost. Light-weight architectures, on the other hand, achieve moderate accuracies, but at a much more desirable latency. This paper presents a new method of jointly using the large accurate models together with the small fast ones. To this end, we propose an Energy-Based Joint Reasoning (EBJR) framework that adaptively distributes the samples between shallow and deep models to achieve an accuracy close to the deep model, but latency close to the shallow one. Our method is applicable to out-of-the-box pre-trained models as it does not require an architecture change nor re-training. Moreover, it is easy to use and deploy, especially for cloud services. Through a comprehensive set of experiments on different down-stream tasks, we show that our method outperforms strong state-of-the-art approaches with a considerable margin. In addition, we propose specialized EBJR, an extension of our method where we create a smaller specialized side model that performs the target task only partially, but yields an even higher accuracy and faster inference. We verify the strengths of our methods with both theoretical and experimental evaluations.
updated: Wed Oct 20 2021 02:33:31 GMT+0000 (UTC)
published: Wed Oct 20 2021 02:33:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト