Bespoke: 低コストの展開のためのブロックレベルのニューラル ネットワーク最適化フレームワーク
Bespoke: A Block-Level Neural Network Optimization Framework for Low-Cost Deployment
ディープ ラーニング モデルの普及に伴い、さまざまなデバイス環境に展開する必要性が高まっています。単一の環境ごとにニューラル ネットワークを開発して最適化するのはコストがかかるため、複数のターゲット環境に対してニューラル ネットワークを効率的に検索する一連の研究があります。しかし、そのような状況に対する既存の作業は、依然として多くの GPU と高価なコストを必要とします。これに動機付けられて、低コストの展開のために Bespoke という名前の新しいニューラル ネットワーク最適化フレームワークを提案します。私たちのフレームワークは、元のモデルの一部をランダムに選択された代替物に置き換えることによって軽量モデルを検索します。それぞれの代替物は、事前トレーニング済みのニューラル ネットワークまたは元のモデルから取得されます。ビスポークには実用面で2つの大きなメリットがあります。 1 つは、ニューラル ネットワークの検索空間を設計するためのコストがゼロに近いことです。もう 1 つのメリットは、パブリックな事前学習済みニューラル ネットワークのサブネットワークを利用するため、既存の作業に比べて総コストが最小限になることです。 Bespoke のメリットを探る実験を行った結果、わずかなコストで複数のターゲットに対して効率的なモデルを見つけることができました。
As deep learning models become popular, there is a lot of need for deploying them to diverse device environments. Because it is costly to develop and optimize a neural network for every single environment, there is a line of research to search neural networks for multiple target environments efficiently. However, existing works for such a situation still suffer from requiring many GPUs and expensive costs. Motivated by this, we propose a novel neural network optimization framework named Bespoke for low-cost deployment. Our framework searches for a lightweight model by replacing parts of an original model with randomly selected alternatives, each of which comes from a pretrained neural network or the original model. In the practical sense, Bespoke has two significant merits. One is that it requires near zero cost for designing the search space of neural networks. The other merit is that it exploits the sub-networks of public pretrained neural networks, so the total cost is minimal compared to the existing works. We conduct experiments exploring Bespoke's the merits, and the results show that it finds efficient models for multiple targets with meager cost.
updated: Fri Nov 17 2023 12:47:26 GMT+0000 (UTC)
published: Fri Mar 03 2023 13:27:00 GMT+0000 (UTC)
