arXiv reaDer
複数のビジュアルドメインでのセマンティックセグメンテーション
Semantic Segmentation on Multiple Visual Domains
セマンティックセグメンテーションモデルは、トレーニング対象のドメインでのみ適切に機能し、トレーニング用のデータセットは不足しており、必要なピクセルレベルの注釈の作成に費用がかかるため、ラベルスペースが小さいことがよくあります。したがって、出力ラベルスペースを増やすには、複数の既存のドメインでモデルをトレーニングすることが望まれます。現在の調査では、マルチドメイントレーニングを使用することでデータセット全体の精度を向上させる可能性があることが示されていますが、これは手動のラベル付けなしで3つの異なる重複しないドメインのデータセットに正常に拡張されていません。この論文では、データセットのすべてのクラスにまたがるラベル空間を作成することにより、データセットCityscapes、SUIM、およびSUNRGB-Dに対してこの方法を提案します。重複するクラスはマージされ、クラスを分離しておくことで不一致の粒度が解決されます。結果は、リソースが無制限ではないため、ハードウェアパフォーマンスが均等化されている場合、マルチドメインモデルの精度は、すべてのベースラインモデルを合わせたものよりも高い精度を示し、共通点がないドメインからでもモデルが追加データの恩恵を受けることを示しています。
Semantic segmentation models only perform well on the domain they are trained on and datasets for training are scarce and often have a small label-spaces, because the pixel level annotations required are expensive to make. Thus training models on multiple existing domains is desired to increase the output label-space. Current research shows that there is potential to improve accuracy across datasets by using multi-domain training, but this has not yet been successfully extended to datasets of three different non-overlapping domains without manual labelling. In this paper a method for this is proposed for the datasets Cityscapes, SUIM and SUN RGB-D, by creating a label-space that spans all classes of the datasets. Duplicate classes are merged and discrepant granularity is solved by keeping classes separate. Results show that accuracy of the multi-domain model has higher accuracy than all baseline models together, if hardware performance is equalized, as resources are not limitless, showing that models benefit from additional data even from domains that have nothing in common.
updated: Fri Jul 09 2021 09:34:51 GMT+0000 (UTC)
published: Fri Jul 09 2021 09:34:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト