インスタンスのセグメンテーションでは、適切なデータ増強から十分なパフォーマンスと利点を得るために、多数のトレーニングサンプルが必要です。トレーニングセットを拡大し、多様性を高めるために、以前の方法では、弱く監督されたメカニズムで他のドメイン(たとえば、bbox、ポイント)からのデータアノテーションを使用して調査しました。このホワイトペーパーでは、既存のインスタンスマスク注釈を使用してトレーニングセットを強化するための、シンプルで効率的かつ効果的な方法を示します。背景のピクセル冗長性を活用して、オブジェクトにランダムジッターを導入するだけで、COCOデータセットで1.7 mAP、Pascal VOCデータセットで3.3 mAPのMask R-CNNのパフォーマンスを向上させることができます。さらに、ローカルな外観の類似性に基づいてオブジェクトを配置できる実行可能な位置を探索するために、位置確率マップベースのアプローチを提案します。このようなマップのガイダンスを使用して、バックボーンまたはネットワーク構造を変更せずに、インスタンスセグメンテーションでのR101-Mask R-CNNのパフォーマンスを35.7 mAPから37.9 mAPに高めます。この方法は実装が簡単で、計算の複雑さを増すことはありません。トレーニングおよび推論の効率に影響を与えることなく、インスタンスのセグメンテーションモデルのトレーニングパイプラインに統合できます。コードとモデルはhttps://github.com/GothicAi/InstaBoostで公開されています
Instance segmentation requires a large number of training samples to achieve satisfactory performance and benefits from proper data augmentation. To enlarge the training set and increase the diversity, previous methods have investigated using data annotation from other domain (e.g. bbox, point) in a weakly supervised mechanism. In this paper, we present a simple, efficient and effective method to augment the training set using the existing instance mask annotations. Exploiting the pixel redundancy of the background, we are able to improve the performance of Mask R-CNN for 1.7 mAP on COCO dataset and 3.3 mAP on Pascal VOC dataset by simply introducing random jittering to objects. Furthermore, we propose a location probability map based approach to explore the feasible locations that objects can be placed based on local appearance similarity. With the guidance of such map, we boost the performance of R101-Mask R-CNN on instance segmentation from 35.7 mAP to 37.9 mAP without modifying the backbone or network structure. Our method is simple to implement and does not increase the computational complexity. It can be integrated into the training pipeline of any instance segmentation model without affecting the training and inference efficiency. Our code and models have been released at https://github.com/GothicAi/InstaBoost