arXiv reaDer
MaX-DeepLab:マスクトランスフォーマーを使用したエンドツーエンドのパノプティコンセグメンテーション
MaX-DeepLab: End-to-End Panoptic Segmentation with Mask Transformers
パノラマセグメンテーションの最初のエンドツーエンドモデルであるMaX-DeepLabを紹介します。私たちのアプローチは、代理サブタスクと、ボックス検出、非最大抑制、モノのマージなどの手動で設計されたコンポーネントに大きく依存する現在のパイプラインを簡素化します。これらのサブタスクはエリアの専門家によって取り組まれますが、失敗します。ターゲットタスクを包括的に解決します。対照的に、MaX-DeepLabは、マスクトランスフォーマーを使用してクラスラベル付きマスクを直接予測し、2部マッチングを介してパノラマ品質に触発された損失でトレーニングされます。当社のマスクトランスフォーマーは、CNNパスに加えてグローバルメモリパスを導入するデュアルパスアーキテクチャを採用しており、任意のCNNレイヤーとの直接通信を可能にします。その結果、MaX-DeepLabは、困難なCOCOデータセットのボックスフリーレジームで7.1%の大幅なPQゲインを示し、ボックスベースの方法とボックスフリーの方法の間のギャップを初めて埋めました。 MaX-DeepLabの小さなバリアントは、同様のパラメーターとM-Addを使用して、DETRよりも3.0%PQを向上させます。さらに、MaX-DeepLabは、テスト時間の拡張なしで、COCOテスト開発セットで新しい最先端の51.3%PQを達成します。コードはhttps://github.com/google-research/deeplab2で入手できます。
We present MaX-DeepLab, the first end-to-end model for panoptic segmentation. Our approach simplifies the current pipeline that depends heavily on surrogate sub-tasks and hand-designed components, such as box detection, non-maximum suppression, thing-stuff merging, etc. Although these sub-tasks are tackled by area experts, they fail to comprehensively solve the target task. By contrast, our MaX-DeepLab directly predicts class-labeled masks with a mask transformer, and is trained with a panoptic quality inspired loss via bipartite matching. Our mask transformer employs a dual-path architecture that introduces a global memory path in addition to a CNN path, allowing direct communication with any CNN layers. As a result, MaX-DeepLab shows a significant 7.1% PQ gain in the box-free regime on the challenging COCO dataset, closing the gap between box-based and box-free methods for the first time. A small variant of MaX-DeepLab improves 3.0% PQ over DETR with similar parameters and M-Adds. Furthermore, MaX-DeepLab, without test time augmentation, achieves new state-of-the-art 51.3% PQ on COCO test-dev set. Code is available at https://github.com/google-research/deeplab2.
updated: Mon Jul 12 2021 21:16:19 GMT+0000 (UTC)
published: Tue Dec 01 2020 19:00:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト