arXiv reaDer
Panoptic SwiftNet: リアルタイム パノプティック セグメンテーションのためのピラミッド フュージョン
Panoptic SwiftNet: Pyramidal Fusion for Real-time Panoptic Segmentation
緻密なパノプティック予測は、自動運転、自動倉庫、リモート センシングなど、多くの既存のアプリケーションの重要な要素です。これらのアプリケーションの多くは、手頃な価格のハードウェアまたは組み込みハードウェアでさえ、大きな入力解像度で高速な推論を必要とします。マルチスケールの特徴抽出のためにバックボーン容量をトレードオフすることにより、この目標を達成することを提案します。パノプティックセグメンテーションへの同時期のアプローチと比較して、私たちの方法の主な新規性は、効率的なスケール等価特徴抽出、ピラミッド型融合によるクロススケールアップサンプリング、およびピクセルからインスタンスへの割り当ての境界認識学習です。提案された方法は、典型的な都市全体および地域全体のデータセットに膨大な数のピクセルがあるため、リモートセンシング画像に非常に適しています。 Cityscapes、Vistas、COCO、BSB-Aerial データセットに関するパノラマ実験を紹介します。私たちのモデルは、FP16 精度と TensorRT 最適化を備えた RTX3090 GPU で 1 秒あたり 100 を超える 1MPx 画像を処理できる一方で、BSB-Aerial データセットで最新技術を上回っています。
Dense panoptic prediction is a key ingredient in many existing applications such as autonomous driving, automated warehouses or remote sensing. Many of these applications require fast inference over large input resolutions on affordable or even embedded hardware. We propose to achieve this goal by trading off backbone capacity for multi-scale feature extraction. In comparison with contemporaneous approaches to panoptic segmentation, the main novelties of our method are efficient scale-equivariant feature extraction, cross-scale upsampling through pyramidal fusion and boundary-aware learning of pixel-to-instance assignment. The proposed method is very well suited for remote sensing imagery due to the huge number of pixels in typical city-wide and region-wide datasets. We present panoptic experiments on Cityscapes, Vistas, COCO and the BSB-Aerial dataset. Our models outperform the state of the art on the BSB-Aerial dataset while being able to process more than a hundred 1MPx images per second on a RTX3090 GPU with FP16 precision and TensorRT optimization.
updated: Tue Apr 18 2023 14:46:07 GMT+0000 (UTC)
published: Tue Mar 15 2022 13:47:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト