arXiv reaDer
分岐マルチタスクネットワーク:共有するレイヤーの決定
Branched Multi-Task Networks: Deciding What Layers To Share
マルチタスク学習のコンテキストでは、分岐アーキテクチャを備えたニューラルネットワークが、手元のタスクに共同で取り組むためにしばしば採用されてきました。このような影響を受けるネットワークは通常、いくつかの共有レイヤーから始まり、その後、さまざまなタスクが独自のレイヤーのシーケンスに分岐します。当然のことながら、可能なネットワーク構成の数は組み合わせ上非常に多いため、共有するレイヤーと分岐する場所を決定するのは面倒になります。これまでの研究は、次善の方法であるレイヤー共有のレベルを決定するためにアドホックな方法に依存しているか、またはかなり高価なネットワーク設計を確立するためにニューラルアーキテクチャ検索技術を利用していました。このホワイトペーパーでは、これらの制限を超えて、採用されたタスクのアフィニティを活用して、分岐されたマルチタスクネットワークを自動的に構築するアプローチを提案します。特定の予算、つまり学習可能なパラメータの数が与えられると、提案されたアプローチは、浅い層がタスクにとらわれないアーキテクチャを生成しますが、深い層は徐々にタスク固有に成長します。多数の多様なマルチタスクデータセットにまたがる広範な実験的分析は、特定の予算では、一定のパフォーマンスしきい値に対して最小量の学習可能なパラメーターを必要とする一方で、特定の予算で、この方法は常に最高のパフォーマンスを持つネットワークを生み出すことを示しています。
In the context of multi-task learning, neural networks with branched architectures have often been employed to jointly tackle the tasks at hand. Such ramified networks typically start with a number of shared layers, after which different tasks branch out into their own sequence of layers. Understandably, as the number of possible network configurations is combinatorially large, deciding what layers to share and where to branch out becomes cumbersome. Prior works have either relied on ad hoc methods to determine the level of layer sharing, which is suboptimal, or utilized neural architecture search techniques to establish the network design, which is considerably expensive. In this paper, we go beyond these limitations and propose an approach to automatically construct branched multi-task networks, by leveraging the employed tasks' affinities. Given a specific budget, i.e. number of learnable parameters, the proposed approach generates architectures, in which shallow layers are task-agnostic, whereas deeper ones gradually grow more task-specific. Extensive experimental analysis across numerous, diverse multi-tasking datasets shows that, for a given budget, our method consistently yields networks with the highest performance, while for a certain performance threshold it requires the least amount of learnable parameters.
updated: Thu Aug 13 2020 06:44:45 GMT+0000 (UTC)
published: Fri Apr 05 2019 08:00:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト