arXiv reaDer
セマンティックセグメンテーションのための球面特徴ピラミッドネットワーク
Spherical Feature Pyramid Networks For Semantic Segmentation
従来の平面アプローチでは球状画像をユークリッド平面に投影する必要があるため、球状データのセマンティック セグメンテーションは機械学習における困難な問題です。根本的に異なるトポロジーで信号を表現すると、ネットワークのパフォーマンスに影響を与えるエッジや歪みが生じます。最近では、グラフベースのアプローチがこれらの課題を回避し、信号を球状メッシュ上に表現することで大幅な改善を達成しています。球状セグメンテーションに対する現在のアプローチは、UNet アーキテクチャのバリアントのみを使用しているため、より成功した平面アーキテクチャは未開発のままです。平面画像セグメンテーションにおける特徴ピラミッド ネットワーク (FPN) の成功に触発され、グラフベースの球状 CNN のピラミッド階層を利用して球状 FPN を設計します。当社の球面 FPN モデルは、使用するパラメーターが少なくても、球面 UNets に比べて一貫した改善を示しています。スタンフォード 2D-3D-S データセット上で、当社のモデルは 48.75 の mIOU という最先端のパフォーマンスを達成し、これまでの最高の球状 CNN と比較して 3.75 IoU ポイントの向上を実現しました。
Semantic segmentation for spherical data is a challenging problem in machine learning since conventional planar approaches require projecting the spherical image to the Euclidean plane. Representing the signal on a fundamentally different topology introduces edges and distortions which impact network performance. Recently, graph-based approaches have bypassed these challenges to attain significant improvements by representing the signal on a spherical mesh. Current approaches to spherical segmentation exclusively use variants of the UNet architecture, meaning more successful planar architectures remain unexplored. Inspired by the success of feature pyramid networks (FPNs) in planar image segmentation, we leverage the pyramidal hierarchy of graph-based spherical CNNs to design spherical FPNs. Our spherical FPN models show consistent improvements over spherical UNets, whilst using fewer parameters. On the Stanford 2D-3D-S dataset, our models achieve state-of-the-art performance with an mIOU of 48.75, an improvement of 3.75 IoU points over the previous best spherical CNN.
updated: Wed Jul 05 2023 21:19:13 GMT+0000 (UTC)
published: Wed Jul 05 2023 21:19:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト