arXiv reaDer
SITA:単一画像のテスト時間の適応
SITA: Single Image Test-time Adaptation
Test-time Adaptation(TTA)では、いくつかのソースデータでトレーニングされたモデルが与えられた場合、目標は、異なる分布からのテストインスタンスのより良い予測を行うためにそれを適応させることです。重要なことに、TTAは、ソースデータへのアクセス、またはソースモデルを微調整するためのターゲット分布からの追加のラベル付き/ラベルなしサンプルへのアクセスさえも想定していません。この作業では、SITA(Single Image Test-time Adaptation)と呼ばれるより実用的な設定でTTAを検討します。ここで、各予測を行うとき、モデルは、文献で一般的に考慮されているように、インスタンスのバッチではなく、特定の単一のテストインスタンスにのみアクセスできます。これは、着信要求を「バッチ化」するために遅延されないオンデマンド方式で推論が必要な現実的なシナリオ、または推論が範囲のないエッジデバイス(携帯電話など)で行われているという現実的なシナリオによって動機付けられています。バッチ処理。 SITAの適応プロセス全体は、推論時に発生するため、非常に高速である必要があります。これに対処するために、順伝播のみを必要とするSITA設定用の新しいアプローチAugBNを提案します。このアプローチでは、既成のトレーニング済みモデルを、分類タスクとセグメンテーションタスクの両方の個々のテストインスタンスに適合させることができます。 AugBNは、ラベル保存変換を使用した1回のフォワードパスのみを使用して、指定されたテスト画像から見えないテスト分布の正規化統計を推定します。 AugBNはバックプロパゲーションを伴わないため、他の最近の方法と比較して大幅に高速です。私たちの知る限り、これは単一のテスト画像のみを使用してこの難しい適応の問題に対処する最初の作業です。非常にシンプルであるにもかかわらず、私たちのフレームワークは、ターゲットインスタンスにソースモデルを直接適用する場合と比較して、大幅なパフォーマンスの向上を実現できます。これは、広範な実験とアブレーション研究に反映されています。
In Test-time Adaptation (TTA), given a model trained on some source data, the goal is to adapt it to make better predictions for test instances from a different distribution. Crucially, TTA assumes no access to the source data or even any additional labeled/unlabeled samples from the target distribution to finetune the source model. In this work, we consider TTA in a more pragmatic setting which we refer to as SITA (Single Image Test-time Adaptation). Here, when making each prediction, the model has access only to the given single test instance, rather than a batch of instances, as has typically been considered in the literature. This is motivated by the realistic scenarios where inference is needed in an on-demand fashion that may not be delayed to "batch-ify" incoming requests or the inference is happening on an edge device (like mobile phone) where there is no scope for batching. The entire adaptation process in SITA should be extremely fast as it happens at inference time. To address this, we propose a novel approach AugBN for the SITA setting that requires only forward propagation. The approach can adapt any off-the-shelf trained model to individual test instances for both classification and segmentation tasks. AugBN estimates normalisation statistics of the unseen test distribution from the given test image using only one forward pass with label-preserving transformations. Since AugBN does not involve any back-propagation, it is significantly faster compared to other recent methods. To the best of our knowledge, this is the first work that addresses this hard adaptation problem using only a single test image. Despite being very simple, our framework is able to achieve significant performance gains compared to directly applying the source model on the target instances, as reflected in our extensive experiments and ablation studies.
updated: Wed Dec 08 2021 09:18:18 GMT+0000 (UTC)
published: Sat Dec 04 2021 15:01:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト