arXiv reaDer
ビデオストリームでのテスト時間トレーニング
Test-Time Training on Video Streams
これまでの研究では、テスト時にトレーニングされたモデルをさらに改善するための一般的なフレームワークとして、テスト時トレーニング (TTT) が確立されてきました。各テスト インスタンスで予測を行う前に、マスクされたオートエンコーダーを使用した画像再構成などの自己教師ありタスクを使用して、同じインスタンスでモデルがトレーニングされます。 TTT をストリーミング設定に拡張し、複数のテスト インスタンス (この場合はビデオ フレーム) が時間順に到着します。私たちの拡張機能はオンライン TTT です。現在のモデルは前のモデルから初期化され、現在のフレームとその直前の小さなフレーム ウィンドウでトレーニングされます。オンライン TTT は、3 つの現実世界のデータセットにおける 4 つのタスクについて、固定モデルのベースラインを大幅に上回りました。たとえばパノプティック セグメンテーションでは、相対的な改善は 45% と 66% です。驚くべきことに、オンライン TTT は、より多くの情報にアクセスし、時間的順序に関係なくテスト ビデオ全体のすべてのフレームをトレーニングするオフライン バージョンよりも優れたパフォーマンスを発揮します。これは、合成ビデオを使用したこれまでの調査結果とは異なります。私たちは、ローカル性をオフライン TTT に対するオンラインの利点として概念化します。私たちは、アブレーションとバイアス分散のトレードオフに基づいた理論による局所性の役割を分析します。
Prior work has established test-time training (TTT) as a general framework to further improve a trained model at test time. Before making a prediction on each test instance, the model is trained on the same instance using a self-supervised task, such as image reconstruction with masked autoencoders. We extend TTT to the streaming setting, where multiple test instances - video frames in our case - arrive in temporal order. Our extension is online TTT: The current model is initialized from the previous model, then trained on the current frame and a small window of frames immediately before. Online TTT significantly outperforms the fixed-model baseline for four tasks, on three real-world datasets. The relative improvement is 45% and 66% for instance and panoptic segmentation. Surprisingly, online TTT also outperforms its offline variant that accesses more information, training on all frames from the entire test video regardless of temporal order. This differs from previous findings using synthetic videos. We conceptualize locality as the advantage of online over offline TTT. We analyze the role of locality with ablations and a theory based on bias-variance trade-off.
updated: Tue Jul 11 2023 05:17:42 GMT+0000 (UTC)
published: Tue Jul 11 2023 05:17:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト