arXiv reaDer
サンプリングによるローカリゼーション-Argmax
Localization with Sampling-Argmax
Soft-argmax演算は、検出ベースの方法で一般的に採用されており、微分可能な方法でターゲット位置を特定します。ただし、soft-argmaxを使用してニューラルネットワークをトレーニングすると、確率マップの形状に制約がなくなります。その結果、モデルはトレーニング中にマップを介したピクセル単位の監視が不足し、パフォーマンスの低下につながります。この作業では、ローカリゼーションエラーの予想を最小化することにより、確率マップの形状に暗黙の制約を課す微分可能なトレーニング方法であるsampling-argmaxを提案します。期待値を概算するために、出力分布の連続定式化を導入し、微分可能なサンプリングプロセスを開発します。期待値は、出力分布から抽出されたすべてのサンプルの平均誤差を計算することで概算できます。さまざまなローカリゼーションタスクで、sampling-argmaxが従来のsoft-argmax操作をシームレスに置き換えることができることを示します。包括的な実験は、提案された方法の有効性と柔軟性を示しています。コードはhttps://github.com/Jeff-sjtu/sampling-argmaxで入手できます。
Soft-argmax operation is commonly adopted in detection-based methods to localize the target position in a differentiable manner. However, training the neural network with soft-argmax makes the shape of the probability map unconstrained. Consequently, the model lacks pixel-wise supervision through the map during training, leading to performance degradation. In this work, we propose sampling-argmax, a differentiable training method that imposes implicit constraints to the shape of the probability map by minimizing the expectation of the localization error. To approximate the expectation, we introduce a continuous formulation of the output distribution and develop a differentiable sampling process. The expectation can be approximated by calculating the average error of all samples drawn from the output distribution. We show that sampling-argmax can seamlessly replace the conventional soft-argmax operation on various localization tasks. Comprehensive experiments demonstrate the effectiveness and flexibility of the proposed method. Code is available at https://github.com/Jeff-sjtu/sampling-argmax
updated: Sun Oct 17 2021 13:56:25 GMT+0000 (UTC)
published: Sun Oct 17 2021 13:56:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト