自然のシーンで透明なオブジェクトを検出することは、テクスチャ、明るさ、色のコントラストが低いため、困難です。最近の深層学習ベースの作業は、透過オブジェクト検出(TOD)に境界を活用することが効果的であることを明らかにしています。ただし、これらの方法では通常、境界に関連する不均衡の問題が発生し、生成機能が制限されます。詳細には、背景の一種の境界は、透明なオブジェクトの境界と同じ特性を共有しますが、量がはるかに少ないため、通常はパフォーマンスが低下します。境界に関連する不均衡の問題を克服するために、FakeMixと呼ばれる新しいコンテンツ依存のデータ拡張方法を提案します。これらのトラブルメーカーの境界をバックグラウンドで収集することは、対応する注釈なしでは難しいことを考慮して、トレーニング中に他のサンプルからの透明なオブジェクトの境界を現在の画像に追加することによってそれらを精巧に生成します。これにより、データスペースが調整され、モデルの一般化が改善されます。さらに、ASPPの拡張バージョンであるAdaptiveASPPを紹介します。これは、マルチスケールおよびクロスモダリティ機能を動的にキャプチャできます。広範な実験は、私たちの方法が最先端の方法を明らかに上回っていることを示しています。また、私たちのアプローチは、モデルがミラー検出、ガラス検出、カモフラージュされたオブジェクト検出などの同様の問題に遭遇する関連タスクでもうまく転送できることを示します。コードは公開されます。
Detecting transparent objects in natural scenes is challenging due to the low contrast in texture, brightness and colors. Recent deep-learning-based works reveal that it is effective to leverage boundaries for transparent object detection (TOD). However, these methods usually encounter boundary-related imbalance problem, leading to limited generation capability. Detailly, a kind of boundaries in the background, which share the same characteristics with boundaries of transparent objects but have much smaller amounts, usually hurt the performance. To conquer the boundary-related imbalance problem, we propose a novel content-dependent data augmentation method termed FakeMix. Considering collecting these trouble-maker boundaries in the background is hard without corresponding annotations, we elaborately generate them by appending the boundaries of transparent objects from other samples into the current image during training, which adjusts the data space and improves the generalization of the models. Further, we present AdaptiveASPP, an enhanced version of ASPP, that can capture multi-scale and cross-modality features dynamically. Extensive experiments demonstrate that our methods clearly outperform the state-of-the-art methods. We also show that our approach can also transfer well on related tasks, in which the model meets similar troubles, such as mirror detection, glass detection, and camouflaged object detection. Code will be made publicly available.