arXiv reaDer
クロスドメイン群集カウントのためのバイレベルアラインメント
Bi-level Alignment for Cross-Domain Crowd Counting
最近、群集密度推定がますます注目されています。このタスクの主な課題は、大量のトレーニングデータに対して高品質の手動注釈を実現することです。このような注釈への依存を回避するために、以前の作業では、簡単にアクセスできる合成データから学習した知識を実際のデータセットに転送することにより、教師なしドメイン適応(UDA)手法を適用しています。ただし、現在の最先端の方法は、補助タスクをトレーニングするために外部データに依存するか、高価な粗いものから細かいものへの推定を適用します。この作業では、適用が簡単で効率的な新しい敵対的学習ベースの方法を開発することを目指しています。合成データと実際のデータの間のドメインギャップを減らすために、(1)タスク駆動型データアライメントと(2)きめ細かい機能アライメントで構成されるバイレベルアライメントフレームワーク(BLA)を設計します。以前のドメイン拡張方法とは対照的に、AutoMLを導入して、ソースで最適な変換を検索します。これは、ダウンストリームタスクに適しています。一方、前景と背景を別々に細かく調整することで、位置合わせの難しさを軽減しています。私たちは、既存のアプローチを大幅に上回っている5つの実際のクラウドカウントベンチマークでアプローチを評価します。また、私たちのアプローチはシンプルで、実装が簡単で、効率的に適用できます。コードはhttps://github.com/Yankeegsj/BLAで公開されています。
Recently, crowd density estimation has received increasing attention. The main challenge for this task is to achieve high-quality manual annotations on a large amount of training data. To avoid reliance on such annotations, previous works apply unsupervised domain adaptation (UDA) techniques by transferring knowledge learned from easily accessible synthetic data to real-world datasets. However, current state-of-the-art methods either rely on external data for training an auxiliary task or apply an expensive coarse-to-fine estimation. In this work, we aim to develop a new adversarial learning based method, which is simple and efficient to apply. To reduce the domain gap between the synthetic and real data, we design a bi-level alignment framework (BLA) consisting of (1) task-driven data alignment and (2) fine-grained feature alignment. In contrast to previous domain augmentation methods, we introduce AutoML to search for an optimal transform on source, which well serves for the downstream task. On the other hand, we do fine-grained alignment for foreground and background separately to alleviate the alignment difficulty. We evaluate our approach on five real-world crowd counting benchmarks, where we outperform existing approaches by a large margin. Also, our approach is simple, easy to implement and efficient to apply. The code is publicly available at https://github.com/Yankeegsj/BLA.
updated: Thu May 12 2022 02:23:25 GMT+0000 (UTC)
published: Thu May 12 2022 02:23:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト