イベントベースのオブジェクト認識のためのシンプルで効果的なテスト時間適応アルゴリズムであるEv-TTAを紹介します。イベントカメラは、速い動きや急激な照明の変化を伴うシーンの測定を提供するために提案されていますが、多くの既存のイベントベースの認識アルゴリズムは、大幅なドメインシフトによる極端な条件下でのパフォーマンスの低下に悩まされています。 Ev-TTAは、イベントの時空間特性に触発された損失関数を使用して、テストフェーズ中に事前トレーニングされた分類器を微調整することにより、深刻なドメインギャップを緩和します。イベントデータは測定の一時的なストリームであるため、損失関数は隣接するイベントに対して同様の予測を実施し、オンラインで変化した環境に迅速に適応します。また、イベントの2つの極性間の空間相関を利用して、極端な照明下でノイズを処理します。この場合、イベントの極性が異なると、独特のノイズ分布が示されます。 Ev-TTAは、広範な追加トレーニングなしで、イベントベースのオブジェクト認識タスクの広い範囲でパフォーマンスが大幅に向上することを示しています。私たちの定式化は、入力表現に関係なく正常に適用でき、回帰タスクにさらに拡張できます。 Ev-TTAは、大幅なドメインシフトが避けられない困難な現実世界のアプリケーションにイベントベースのビジョンアルゴリズムを展開するための重要な手法を提供することを期待しています。
We introduce Ev-TTA, a simple, effective test-time adaptation algorithm for event-based object recognition. While event cameras are proposed to provide measurements of scenes with fast motions or drastic illumination changes, many existing event-based recognition algorithms suffer from performance deterioration under extreme conditions due to significant domain shifts. Ev-TTA mitigates the severe domain gaps by fine-tuning the pre-trained classifiers during the test phase using loss functions inspired by the spatio-temporal characteristics of events. Since the event data is a temporal stream of measurements, our loss function enforces similar predictions for adjacent events to quickly adapt to the changed environment online. Also, we utilize the spatial correlations between two polarities of events to handle noise under extreme illumination, where different polarities of events exhibit distinctive noise distributions. Ev-TTA demonstrates a large amount of performance gain on a wide range of event-based object recognition tasks without extensive additional training. Our formulation can be successfully applied regardless of input representations and further extended into regression tasks. We expect Ev-TTA to provide the key technique to deploy event-based vision algorithms in challenging real-world applications where significant domain shift is inevitable.