arXiv reaDer
すべてのスケールでのパノプティコンセグメンテーションの改善
Improving Panoptic Segmentation at All Scales
作物ベースのトレーニング戦略は、トレーニング解像度をGPUメモリ消費から切り離し、数メガピクセルの画像で大容量のパノプティコンセグメンテーションネットワークを使用できるようにします。ただし、作物を使用すると、大きなオブジェクトを切り捨てたり、欠落させたりする傾向が生じる可能性があります。これに対処するために、新しい作物認識バウンディングボックス回帰損失(CABB損失)を提案します。これは、作物の外側に広がることで過度にペナルティを課すことなく、作物のオブジェクトの可視部分と一致する予測を促進します。さらに、オブジェクトサイズの不均衡な分布を打ち消すことにより、スケール全体の一般化を改善する新しいデータサンプリングおよび拡張戦略を紹介します。これら2つの貢献を慎重に設計されたトップダウンのパノプティコンセグメンテーションアーキテクチャと組み合わせることで、挑戦的なMapillary Vistas(MVD)、Indian Driving、Cityscapesデータセットで新しい最先端の結果が得られ、MVDでこれまでの最良のアプローチを上回ります。 + 4.5%PQおよび+ 5.2%mAP。
Crop-based training strategies decouple training resolution from GPU memory consumption, allowing the use of large-capacity panoptic segmentation networks on multi-megapixel images. Using crops, however, can introduce a bias towards truncating or missing large objects. To address this, we propose a novel crop-aware bounding box regression loss (CABB loss), which promotes predictions to be consistent with the visible parts of the cropped objects, while not over-penalizing them for extending outside of the crop. We further introduce a novel data sampling and augmentation strategy which improves generalization across scales by counteracting the imbalanced distribution of object sizes. Combining these two contributions with a carefully designed, top-down panoptic segmentation architecture, we obtain new state-of-the-art results on the challenging Mapillary Vistas (MVD), Indian Driving and Cityscapes datasets, surpassing the previously best approach on MVD by +4.5% PQ and +5.2% mAP.
updated: Mon Dec 14 2020 17:11:00 GMT+0000 (UTC)
published: Mon Dec 14 2020 17:11:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト