最近の研究では、オプティカル フローは、明るさ一定の仮定と事前の滑らかさに基づいて、ラベルのない画像ペアからディープ ネットワークによって学習できることが示されています。現在のアプローチはさらに、継続的な自己監視のために拡張正則化項を課しています。これは、マッチングが困難な領域で効果的であることが証明されています。ただし、この方法では、教師なしの設定で避けられない不一致も増幅され、最適解への学習プロセスがブロックされます。ジレンマを打破するために、信頼できる知識を教師と生徒のネットワーク間でやり取りして改善するための新しい相互蒸留フレームワークを提案します。具体的には、既製の教師なしアプローチの推定を疑似ラベルとして使用することで、私たちの洞察は、信頼できる選択メカニズムを定義して、相対的に適切な一致を抽出し、教師から生徒への適切で信頼できる知識を抽出するために多様なデータ拡張を追加することにあります。私たちの方法の分離の性質のおかげで、十分な学習のためにより強力な学生アーキテクチャを選択できます。最後に、より優れた生徒予測を採用して、実際の展開で追加コストをかけずに知識を有能な教師に戻すことができます。これを教師ありタスクとして定式化するのではなく、マルチターゲット学習に追加の教師なし項を導入すると、最良の最終結果が得られることがわかりました。広範な実験により、MDFlow と呼ばれる私たちのアプローチが、困難なベンチマークで最先端のリアルタイム精度と一般化能力を達成することが示されています。コードは https://github.com/ltkong218/MDFlow で入手できます。
Recent works have shown that optical flow can be learned by deep networks from unlabelled image pairs based on brightness constancy assumption and smoothness prior. Current approaches additionally impose an augmentation regularization term for continual self-supervision, which has been proved to be effective on difficult matching regions. However, this method also amplify the inevitable mismatch in unsupervised setting, blocking the learning process towards optimal solution. To break the dilemma, we propose a novel mutual distillation framework to transfer reliable knowledge back and forth between the teacher and student networks for alternate improvement. Concretely, taking estimation of off-the-shelf unsupervised approach as pseudo labels, our insight locates at defining a confidence selection mechanism to extract relative good matches, and then add diverse data augmentation for distilling adequate and reliable knowledge from teacher to student. Thanks to the decouple nature of our method, we can choose a stronger student architecture for sufficient learning. Finally, better student prediction is adopted to transfer knowledge back to the efficient teacher without additional costs in real deployment. Rather than formulating it as a supervised task, we find that introducing an extra unsupervised term for multi-target learning achieves best final results. Extensive experiments show that our approach, termed MDFlow, achieves state-of-the-art real-time accuracy and generalization ability on challenging benchmarks. Code is available at https://github.com/ltkong218/MDFlow.