arXiv reaDer
パノプティコンセグメンテーションとリモートセンシングの出会い
Panoptic Segmentation Meets Remote Sensing
パノプティコンセグメンテーションは、インスタンスとセマンティックの予測を組み合わせて、「もの」と「もの」を同時に検出できるようにします。リモートセンシングデータでパノプティコンセグメンテーションに効果的にアプローチすることは、継続的なマッピングと特定のターゲットカウントを可能にするため、多くの困難な問題で縁起の良いものになる可能性があります。リモートセンシングにおけるこのタスクの成長を妨げるいくつかの問題があります。(a)ほとんどのアルゴリズムは従来の画像用に設計されており、(b)画像のラベル付けには「things」クラスと「stuff」クラスを含める必要があり、(c)注釈形式は複雑です。したがって、リモートセンシングにおけるパノプティコンセグメンテーションの操作性を解決および向上させることを目的として、この研究には5つの目的があります。(1)パノプティコンセグメンテーション用の新しいデータ準備パイプラインを作成する。 (3)都市部に関する新しいデータセットを提案し、(4)タスク用にDetectron2を変更し、(5)都市環境におけるこのタスクの難しさを評価します。 14のクラスを考慮して、0.24メートルの空間解像度の航空写真を使用しました。私たちのパイプラインは3つの画像入力を考慮し、提案されたソフトウェアはCOCO形式でサンプルを作成するためにポイントシェープファイルを使用します。私たちの研究では、512x512ピクセルのサイズで3,400のサンプルが生成されました。 2つのバックボーン(ResNet-50とResNet-101)を備えたPanoptic-FPNを使用し、モデル評価ではセマンティックインスタンスとパノプティコンメトリックを考慮しました。平均IoU、ボックスAP、およびPQについて、93.9、47.7、および64.9を取得しました。私たちの研究は、パノプティコンセグメンテーションのための最初の効果的なパイプラインと、他の研究者がシーンの完全な理解を必要とする他のデータまたは関連する問題を使用および処理するための広範なデータベースを示しています。
Panoptic segmentation combines instance and semantic predictions, allowing the detection of "things" and "stuff" simultaneously. Effectively approaching panoptic segmentation in remotely sensed data can be auspicious in many challenging problems since it allows continuous mapping and specific target counting. Several difficulties have prevented the growth of this task in remote sensing: (a) most algorithms are designed for traditional images, (b) image labelling must encompass "things" and "stuff" classes, and (c) the annotation format is complex. Thus, aiming to solve and increase the operability of panoptic segmentation in remote sensing, this study has five objectives: (1) create a novel data preparation pipeline for panoptic segmentation, (2) propose an annotation conversion software to generate panoptic annotations; (3) propose a novel dataset on urban areas, (4) modify the Detectron2 for the task, and (5) evaluate difficulties of this task in the urban setting. We used an aerial image with a 0,24-meter spatial resolution considering 14 classes. Our pipeline considers three image inputs, and the proposed software uses point shapefiles for creating samples in the COCO format. Our study generated 3,400 samples with 512x512 pixel dimensions. We used the Panoptic-FPN with two backbones (ResNet-50 and ResNet-101), and the model evaluation considered semantic instance and panoptic metrics. We obtained 93.9, 47.7, and 64.9 for the mean IoU, box AP, and PQ. Our study presents the first effective pipeline for panoptic segmentation and an extensive database for other researchers to use and deal with other data or related problems requiring a thorough scene understanding.
updated: Tue Nov 30 2021 12:42:11 GMT+0000 (UTC)
published: Tue Nov 23 2021 19:48:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト