arXiv reaDer
マルチタスク学習における転移の測定と活用
Measuring and Harnessing Transference in Multi-Task Learning
マルチタスク学習は、1つのタスクで学習した情報を活用して、他のタスクのトレーニングに役立てることができます。この能力にもかかわらず、ナイーブな定式化はしばしばパフォーマンスを低下させ、特に、共同トレーニングから利益を得るタスクを特定することは、設計上の難しい問題のままです。このホワイトペーパーでは、トレーニング全体のタスク全体での情報転送または転送のダイナミクスを分析します。具体的には、タスク間の転移を定量化できる類似性の尺度を開発し、この量を使用して、マルチタスク学習の最適化ダイナミクスをよりよく理解し、全体的な学習パフォーマンスを向上させます。後者の場合、転移メトリックを活用するために2つの方法を提案します。 1つ目は、一緒にトレーニングするタスクを選択することでマクロレベルで動作し、2つ目は、各トレーニングステップでタスクの勾配を組み合わせる方法を決定することでミクロレベルで機能します。これらの方法は、3つの教師ありマルチタスク学習ベンチマークと1つのマルチタスク強化学習パラダイムに関する以前の作業に比べて大幅な改善につながる可能性があることがわかりました。
Multi-task learning can leverage information learned by one task to benefit the training of other tasks. Despite this capacity, naive formulations often degrade performance and in particular, identifying the tasks that would benefit from co-training remains a challenging design question. In this paper, we analyze the dynamics of information transfer, or transference, across tasks throughout training. Specifically, we develop a similarity measure that can quantify transference among tasks and use this quantity to both better understand the optimization dynamics of multi-task learning as well as improve overall learning performance. In the latter case, we propose two methods to leverage our transference metric. The first operates at a macro-level by selecting which tasks should train together while the second functions at a micro-level by determining how to combine task gradients at each training step. We find these methods can lead to significant improvement over prior work on three supervised multi-task learning benchmarks and one multi-task reinforcement learning paradigm.
updated: Fri Sep 10 2021 06:55:37 GMT+0000 (UTC)
published: Thu Oct 29 2020 08:25:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト