arXiv reaDer
正確なインスタンスのセグメンテーションのための指向ボックス
Oriented Boxes for Accurate Instance Segmentation
 最先端のインスタンス対応セマンティックセグメンテーションアルゴリズムは、最終インスタンスマスク出力を推測するための中間処理ステップとして軸に合わせた境界ボックスを使用します。これは、次の理由により、しばしば粗くて不正確なマスクの提案につながります:軸に沿ったボックスは前景のピクセル比に対する背景が高く、下にあるボックスに対するマスクターゲットの強いバリエーションがあり、近隣のインスタンスが頻繁に到達します対象のインスタンスマスクの軸に沿った境界ボックス。この作業では、インスタンスマスクを推論するための基礎として指向ボックスを使用することを提案することにより、これらの問題を克服します。特に、オブジェクトが斜めに整列、接触、または互いに重なり合っている場合、インスタンス指向のセグメント化によりマスク予測が改善されることを示します。 D2SデータセットとScrewsデータセットでモデルを評価し、軸に合わせた境界ボックスを使用したインスタンスセグメンテーションと比較して、マスク精度をそれぞれ10%および12%mAP大幅に改善できることを示します。新しく導入されたピルバッグデータセットでは、マスクアノテーションの10%のみを使用してベースラインよりも優れています。
State-of-the-art instance-aware semantic segmentation algorithms use axis-aligned bounding boxes as an intermediate processing step to infer the final instance mask output. This often leads to coarse and inaccurate mask proposals due to the following reasons: Axis-aligned boxes have a high background to foreground pixel-ratio, there is a strong variation of mask targets with respect to the underlying box, and neighboring instances frequently reach into the axis-aligned bounding box of the instance mask of interest. In this work, we overcome these problems by proposing to use oriented boxes as the basis to infer instance masks. We show that oriented instance segmentation improves the mask predictions, especially when objects are diagonally aligned, touching, or overlapping each other. We evaluate our model on the D2S and Screws datasets and show that we can significantly improve the mask accuracy by 10% and 12% mAP compared to instance segmentation using axis-aligned bounding boxes, respectively. On the newly introduced Pill Bags dataset we outperform the baseline using only 10% of the mask annotations.
updated: Fri Mar 13 2020 10:36:01 GMT+0000 (UTC)
published: Mon Nov 18 2019 16:01:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト