arXiv reaDer
MAE-GEBD:CVPR'2023 LOVEU-GEBD チャレンジで優勝
MAE-GEBD:Winning the CVPR'2023 LOVEU-GEBD Challenge
一般イベント境界検出 (GEBD) タスクは、さまざまなクラスに適用できる一般イベント境界を検出することにより、ビデオをセグメントに分割するモデルを構築することを目的としています。この論文では、昨年の MAE-GEBD 手法に基づいて、データ処理戦略と損失関数を調整することで GEBD タスク上のモデルのパフォーマンスを向上させました。昨年のアプローチに基づいて、私たちは擬似ラベルの適用をより大きなデータセットに拡張し、多くの実験的な試みを行いました。さらに、焦点損失を適用して困難なサンプルにさらに集中し、モデルのパフォーマンスを向上させました。最後に、昨年使用したセグメンテーション調整戦略を改善し、ビデオの境界密度と長さに応じてセグメンテーション調整方法を動的に調整しました。これにより、モデルがより柔軟になり、さまざまな状況に完全に適用できるようになりました。私たちの方法では、Kinetics-GEBD テストセットで 86.03% の F1 スコアを達成しました。これは、2022 Kinetics-GEBD 方法と比較して F1 スコアが 0.09% 向上しました。
The Generic Event Boundary Detection (GEBD) task aims to build a model for segmenting videos into segments by detecting general event boundaries applicable to various classes. In this paper, based on last year's MAE-GEBD method, we have improved our model performance on the GEBD task by adjusting the data processing strategy and loss function. Based on last year's approach, we extended the application of pseudo-label to a larger dataset and made many experimental attempts. In addition, we applied focal loss to concentrate more on difficult samples and improved our model performance. Finally, we improved the segmentation alignment strategy used last year, and dynamically adjusted the segmentation alignment method according to the boundary density and duration of the video, so that our model can be more flexible and fully applicable in different situations. With our method, we achieve an F1 score of 86.03% on the Kinetics-GEBD test set, which is a 0.09% improvement in the F1 score compared to our 2022 Kinetics-GEBD method.
updated: Tue Jun 27 2023 02:35:19 GMT+0000 (UTC)
published: Tue Jun 27 2023 02:35:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト