arXiv reaDer
エンドツーエンドのビデオ学習のためのバッチ正規化の落とし穴について:外科的ワークフロー分析に関する研究
On the Pitfalls of Batch Normalization for End-to-End Video Learning: A Study on Surgical Workflow Analysis
バッチ内の他のサンプルに依存するというバッチ正規化(BN)の固有の特性は、シーケンシャルモデリングを含むいくつかのタスクで問題を引き起こすことが知られており、これらの分野で代替案を使用するようになりました。ただし、ビデオ学習では、視覚的特徴抽出のためにCNNでBNが広く使用されているにもかかわらず、これらの問題はあまり研究されていません。 BNの特性は、CNNと時間モデルをビデオタスクでエンドツーエンドでトレーニングする上で大きな障害となると主張します。それでも、十分に訓練された特徴抽出器がない外科ワークフロー分析などの専門分野では、エンドツーエンドの学習が望ましいようです。外科ワークフロー分析のこれまでの研究では、複雑な多段階の学習手順を通じてBN関連の問題を回避してきましたが、BNを使用しないCNNを使用すると、単純なエンドツーエンドのCNN-LSTMでも最先端のパフォーマンスを上回ることができることを示しています。さらに、外科的予測タスクでの「不正行為」現象など、BN関連の問題が発生した場合に詳細に分析します。 BNの限界をより深く理解し、エンドツーエンドのアプローチを再検討することが、外科的ワークフロー分析と一般的なビデオ学習の将来の研究に役立つことを願っています。
Batch Normalization's (BN) unique property of depending on other samples in a batch is known to cause problems in several tasks, including sequential modeling, and has led to the use of alternatives in these fields. In video learning, however, these problems are less studied, despite the ubiquitous use of BN in CNNs for visual feature extraction. We argue that BN's properties create major obstacles for training CNNs and temporal models end to end in video tasks. Yet, end-to-end learning seems preferable in specialized domains such as surgical workflow analysis, which lack well-pretrained feature extractors. While previous work in surgical workflow analysis has avoided BN-related issues through complex, multi-stage learning procedures, we show that even simple, end-to-end CNN-LSTMs can outperform the state of the art when CNNs without BN are used. Moreover, we analyze in detail when BN-related issues occur, including a "cheating" phenomenon in surgical anticipation tasks. We hope that a deeper understanding of BN's limitations and a reconsideration of end-to-end approaches can be beneficial for future research in surgical workflow analysis and general video learning.
updated: Tue Mar 15 2022 15:05:40 GMT+0000 (UTC)
published: Tue Mar 15 2022 15:05:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト