arXiv reaDer
DupNet: Towards Very Tiny Quantized CNN with Improved Accuracy for Face Detection
 深層学習ベースの顔検出器をエッジデバイスに展開することは、計算リソースが限られているため、難しい作業です。非常に小さなネットワークの重みを2進数化すると、モデルサイズ(IFQ-Tinier-YOLOの場合は240.9 KBなど)が非常にコンパクトになりますが、メモリの制約が厳しい組み込みデバイスに収まるほど小さくありません。この論文では、2つの部分で構成されるDupNetを提案します。まず、モデルのサイズを縮小するために、重量が集中するレイヤーに重複したチャネルを持つウェイトを使用します。第二に、量子化が顕著な精度低下を引き起こす量子化に敏感なレイヤーの場合、入力フィーチャマップを複製します。これにより、より代表的な出力を畳み込むためにより多くの重みチャネルを使用できます。それに基づいて、非常に小さな顔検出器、DupNet-Tinier-YOLOを提案します。DupNet-Tinier-YOLOは、モデルサイズが6.5倍小さく、計算が42.0%少ない一方で、IFQ-Tinier-YOLOより2.4%高い検出を実現します。 DupNet-Tinier-YOLOは、完全な精度のTiny-YOLOと比較して、モデルサイズと計算の複雑さをそれぞれ1,694.2倍と389.9倍節約し、検出率はわずか4.0%低下します(0.880対0.920)。さらに、当社のDupNet-Tinier-YOLOはわずか36.9 KBであり、これは私たちの知る限りでは最も小さな深層探知機です。
Deploying deep learning based face detectors on edge devices is a challenging task due to the limited computation resources. Even though binarizing the weights of a very tiny network gives impressive compactness on model size (e.g. 240.9 KB for IFQ-Tinier-YOLO), it is not tiny enough to fit in the embedded devices with strict memory constraints. In this paper, we propose DupNet which consists of two parts. Firstly, we employ weights with duplicated channels for the weight-intensive layers to reduce the model size. Secondly, for the quantization-sensitive layers whose quantization causes notable accuracy drop, we duplicate its input feature maps. It allows us to use more weights channels for convolving more representative outputs. Based on that, we propose a very tiny face detector, DupNet-Tinier-YOLO, which is 6.5X times smaller on model size and 42.0% less complex on computation and meanwhile achieves 2.4% higher detection than IFQ-Tinier-YOLO. Comparing with the full precision Tiny-YOLO, our DupNet-Tinier-YOLO gives 1,694.2X and 389.9X times savings on model size and computation complexity respectively with only 4.0% drop on detection rate (0.880 vs. 0.920). Moreover, our DupNet-Tinier-YOLO is only 36.9 KB, which is the tiniest deep face detector to our best knowledge.
updated: Wed Nov 13 2019 08:00:26 GMT+0000 (UTC)
published: Wed Nov 13 2019 08:00:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト