arXiv reaDer
密な予測のための構造化知識蒸留
Structured Knowledge Distillation for Dense Prediction
この作業では、コンピュータービジョンの高密度予測タスクのために、大規模ネットワークからコンパクトネットワークに構造情報を転送することを検討します。密度の高い予測タスクに使用される以前の知識抽出戦略は、多くの場合、画像分類の蒸留スキームを直接借用し、各ピクセルに対して個別に知識抽出を実行するため、最適とは言えないパフォーマンスにつながります。ここでは、密な予測が構造化予測の問題であることを考慮して、構造化された知識を大規模ネットワークからコンパクトネットワークに蒸留することを提案します。具体的には、2つの構造化蒸留スキームを検討します。i)静的グラフを作成してペアワイズの類似点を抽出するペアワイズ蒸留。 ii)全体論的知識を蒸留するために敵対的なトレーニングを使用する全体論的蒸留。私たちの知識蒸留アプローチの有効性は、セマンティックセグメンテーション、深度推定、オブジェクト検出という3つの密な予測タスクの実験によって実証されています。コードは、https://git.io/StructKDで入手できます。
In this work, we consider transferring the structure information from large networks to compact ones for dense prediction tasks in computer vision. Previous knowledge distillation strategies used for dense prediction tasks often directly borrow the distillation scheme for image classification and perform knowledge distillation for each pixel separately, leading to sub-optimal performance. Here we propose to distill structured knowledge from large networks to compact networks, taking into account the fact that dense prediction is a structured prediction problem. Specifically, we study two structured distillation schemes: i) pair-wise distillation that distills the pair-wise similarities by building a static graph; and ii) holistic distillation that uses adversarial training to distill holistic knowledge. The effectiveness of our knowledge distillation approaches is demonstrated by experiments on three dense prediction tasks: semantic segmentation, depth estimation and object detection. Code is available at: https://git.io/StructKD
updated: Sun Jun 14 2020 13:37:24 GMT+0000 (UTC)
published: Mon Mar 11 2019 10:05:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト