arXiv reaDer
SGAT4PASS: パノラミック セマンティック セグメンテーション用の球面ジオメトリ対応トランスフォーマー
SGAT4PASS: Spherical Geometry-Aware Transformer for PAnoramic Semantic Segmentation
コンピューター ビジョンにおける重要かつ困難な問題として、パノラミック セマンティック セグメンテーション (PASS) は、超広角の画角に基づいて完全なシーン認識を提供します。通常、2D パノラマ画像入力で普及している PASS 手法は、画像の歪みを解決することに焦点を当てていますが、元の 360^∘ データの 3D 特性は考慮されていません。したがって、3D 乱れのあるパノラマ画像を入力すると、パフォーマンスが大幅に低下します。 3D 外乱に対する堅牢性を高めるために、3D 球面幾何学の知識を考慮した Spherical Geometry-Aware Transformer for PAnoramic Semantic Segmentation (SGAT4PASS) を提案します。具体的には、球面幾何学を意識したフレームワークが PASS 用に提案されています。これには、球面幾何学認識画像投影、球面変形可能パッチ埋め込み、およびパノラマ認識損失の 3 つのモジュールが含まれており、3D 外乱を含む入力画像を考慮し、既存の変形可能パッチ埋め込みに球面幾何学認識制約を追加します。と はそれぞれ元の 360^∘ データのピクセル密度を示します。 Stanford2D3D パノラマ データセットの実験結果では、SGAT4PASS がパフォーマンスとロバスト性を大幅に向上させ、mIoU が約 2% 増加し、データ内で小さな 3D 障害が発生した場合、パフォーマンスの安定性が 1 桁向上することが示されています。コードと補足資料は https://github.com/TencentARC/SGAT4PASS で入手できます。
As an important and challenging problem in computer vision, PAnoramic Semantic Segmentation (PASS) gives complete scene perception based on an ultra-wide angle of view. Usually, prevalent PASS methods with 2D panoramic image input focus on solving image distortions but lack consideration of the 3D properties of original 360^∘ data. Therefore, their performance will drop a lot when inputting panoramic images with the 3D disturbance. To be more robust to 3D disturbance, we propose our Spherical Geometry-Aware Transformer for PAnoramic Semantic Segmentation (SGAT4PASS), considering 3D spherical geometry knowledge. Specifically, a spherical geometry-aware framework is proposed for PASS. It includes three modules, i.e., spherical geometry-aware image projection, spherical deformable patch embedding, and a panorama-aware loss, which takes input images with 3D disturbance into account, adds a spherical geometry-aware constraint on the existing deformable patch embedding, and indicates the pixel density of original 360^∘ data, respectively. Experimental results on Stanford2D3D Panoramic datasets show that SGAT4PASS significantly improves performance and robustness, with approximately a 2% increase in mIoU, and when small 3D disturbances occur in the data, the stability of our performance is improved by an order of magnitude. Our code and supplementary material are available at https://github.com/TencentARC/SGAT4PASS.
updated: Tue Jun 06 2023 04:49:51 GMT+0000 (UTC)
published: Tue Jun 06 2023 04:49:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト