arXiv reaDer
教師なし魚の軌道追跡とセグメンテーション
Unsupervised Fish Trajectory Tracking and Segmentation
高品質のラベルに基づく魚の追跡とセグメンテーションのための DNN は高価です。代替の教師なしアプローチは、ビデオ データで自然に発生する空間的および時間的変動に依存して、ノイズの多い疑似グラウンド トゥルース ラベルを生成します。これらの疑似ラベルは、マルチタスク ディープ ニューラル ネットワークのトレーニングに使用されます。この論文では、堅牢な魚の追跡とセグメンテーションのための 3 段階のフレームワークを提案します。最初の段階は、フレーム間の空間的および時間的一貫性を使用して疑似ラベルを生成するオプティカル フロー モデルです。第 2 段階では、自己教師ありモデルが疑似ラベルを段階的に改良します。第 3 段階では、洗練されたラベルを使用してセグメンテーション ネットワークをトレーニングします。トレーニングまたは推論中に人間による注釈は使用されません。 3 つの公開水中ビデオ データセットでこの方法を検証し、ビデオの注釈とセグメンテーションに非常に効果的であることを実証するために、広範な実験が行われます。また、さまざまなイメージング条件に対するフレームワークの堅牢性を評価し、現在の実装の制限について説明します。
DNN for fish tracking and segmentation based on high-quality labels is expensive. Alternative unsupervised approaches rely on spatial and temporal variations that naturally occur in video data to generate noisy pseudo-ground-truth labels. These pseudo-labels are used to train a multi-task deep neural network. In this paper, we propose a three-stage framework for robust fish tracking and segmentation, where the first stage is an optical flow model, which generates the pseudo labels using spatial and temporal consistency between frames. In the second stage, a self-supervised model refines the pseudo-labels incrementally. In the third stage, the refined labels are used to train a segmentation network. No human annotations are used during the training or inference. Extensive experiments are performed to validate our method on three public underwater video datasets and to demonstrate that it is highly effective for video annotation and segmentation. We also evaluate the robustness of our framework to different imaging conditions and discuss the limitations of our current implementation.
updated: Tue Aug 23 2022 01:01:27 GMT+0000 (UTC)
published: Tue Aug 23 2022 01:01:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト