arXiv reaDer
Drop-DTW:外れ値をドロップしながらシーケンス間の共通信号を整列させる
Drop-DTW: Aligning Common Signal Between Sequences While Dropping Outliers
この作業では、外れ値を含む信号のシーケンス間アラインメントの問題を検討します。外れ値がないと仮定すると、標準の動的タイムワーピング(DTW)アルゴリズムは、2つの(一般的に)可変長シーケンス間の最適なアラインメントを効率的に計算します。 DTWは信号の時間的シフトと拡張に対してロバストですが、シーケンスに任意に散在する可能性のある外れ値が存在する場合、意味のある方法でシーケンスを整列させることができません。この問題に対処するために、Drop-DTWを導入します。これは、シーケンス間の共通信号を整列させ、マッチングから外れ値要素を自動的に削除する新しいアルゴリズムです。手順全体は、効率的で完全に区別可能な単一の動的プログラムとして実装されます。私たちの実験では、Drop-DTWがシーケンス検索の堅牢な類似性指標であることを示し、さまざまなアプリケーションでのトレーニング損失としての有効性を示しています。 Drop-DTWを使用して、教育ビデオの時間的ステップローカリゼーション、ノイズの多いビデオからの表現学習、および視聴覚検索とローカリゼーションのためのクロスモーダル表現学習に対処します。すべてのアプリケーションで、弱くまたは監視されていないアプローチを採用し、これらの設定で最先端の結果を示します。
In this work, we consider the problem of sequence-to-sequence alignment for signals containing outliers. Assuming the absence of outliers, the standard Dynamic Time Warping (DTW) algorithm efficiently computes the optimal alignment between two (generally) variable-length sequences. While DTW is robust to temporal shifts and dilations of the signal, it fails to align sequences in a meaningful way in the presence of outliers that can be arbitrarily interspersed in the sequences. To address this problem, we introduce Drop-DTW, a novel algorithm that aligns the common signal between the sequences while automatically dropping the outlier elements from the matching. The entire procedure is implemented as a single dynamic program that is efficient and fully differentiable. In our experiments, we show that Drop-DTW is a robust similarity measure for sequence retrieval and demonstrate its effectiveness as a training loss on diverse applications. With Drop-DTW, we address temporal step localization on instructional videos, representation learning from noisy videos, and cross-modal representation learning for audio-visual retrieval and localization. In all applications, we take a weakly- or unsupervised approach and demonstrate state-of-the-art results under these settings.
updated: Thu Aug 26 2021 18:52:35 GMT+0000 (UTC)
published: Thu Aug 26 2021 18:52:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト