arXiv reaDer
UFO:統一された機能の最適化
UFO: Unified Feature Optimization
このホワイトペーパーでは、複数のAI機能のコレクションを必要とする、現実世界および大規模なシナリオでディープモデルをトレーニングおよび展開するための新しい統合機能最適化(UFO)パラダイムを提案します。 UFOは、すべてのタスクについて大規模な事前トレーニングを行うことで、各タスクに利益をもたらすことを目指しています。よく知られている基礎モデルと比較して、UFOには2つの異なる重点点があります。つまり、モデルサイズが比較的小さく、適応コストがありません。1)UFOは、マルチタスク学習方式で幅広いタスクを中規模の統合モデルに圧縮します。さらに、ダウンストリームタスクに転送されるときにモデルサイズをトリミングします。 2)UFOは、新しいタスクへの移行を強調していません。代わりに、トリミングされたモデルを1つ以上のすでに見たタスク専用にすることを目的としています。これらの2つの特性により、UFOは、大規模な事前トレーニングの利点を維持しながら、柔軟な展開に非常に便利です。 UFOの主なメリットは、トリミングプロセスによってモデルのサイズと推論の消費が削減されるだけでなく、特定のタスクの精度も向上することです。具体的には、UFOはマルチタスクトレーニングを考慮し、統合モデルに2つの影響をもたらします。密接に関連するタスクには相互にメリットがあるものもあれば、互いに競合するものもあります。 UFOは、新しいネットワークアーキテクチャ検索(NAS)方式を通じて、競合を減らし、相互利益を維持することに成功しています。幅広い深層表現学習タスク(つまり、顔認識、人物の再識別、車両の再識別、製品検索)での実験は、UFOからトリミングされたモデルが、単一タスクでトレーニングされたモデルよりも高い精度を達成していることを示しています。より小さなモデルサイズ、UFOの概念を検証します。さらに、UFOは、業界最大のCVモデルである170億パラメーターのコンピュータービジョン(CV)基盤モデルのリリースもサポートしました。
This paper proposes a novel Unified Feature Optimization (UFO) paradigm for training and deploying deep models under real-world and large-scale scenarios, which requires a collection of multiple AI functions. UFO aims to benefit each single task with a large-scale pretraining on all tasks. Compared with the well known foundation model, UFO has two different points of emphasis, i.e., relatively smaller model size and NO adaptation cost: 1) UFO squeezes a wide range of tasks into a moderate-sized unified model in a multi-task learning manner and further trims the model size when transferred to down-stream tasks. 2) UFO does not emphasize transfer to novel tasks. Instead, it aims to make the trimmed model dedicated for one or more already-seen task. With these two characteristics, UFO provides great convenience for flexible deployment, while maintaining the benefits of large-scale pretraining. A key merit of UFO is that the trimming process not only reduces the model size and inference consumption, but also even improves the accuracy on certain tasks. Specifically, UFO considers the multi-task training and brings two-fold impact on the unified model: some closely related tasks have mutual benefits, while some tasks have conflicts against each other. UFO manages to reduce the conflicts and to preserve the mutual benefits through a novel Network Architecture Search (NAS) method. Experiments on a wide range of deep representation learning tasks (i.e., face recognition, person re-identification, vehicle re-identification and product retrieval) show that the model trimmed from UFO achieves higher accuracy than its single-task-trained counterpart and yet has smaller model size, validating the concept of UFO. Besides, UFO also supported the release of 17 billion parameters computer vision (CV) foundation model which is the largest CV model in the industry.
updated: Thu Jul 21 2022 07:34:06 GMT+0000 (UTC)
published: Thu Jul 21 2022 07:34:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト