arXiv reaDer
スケルトン抽出のためのコンテキスト注意ネットワーク
Context Attention Network for Skeleton Extraction
スケルトン抽出は、指定されたバイナリまたはRGB画像からスケルトンを抽出することにより、オブジェクトの単純な表現を提供することに焦点を当てたタスクです。近年、骨格抽出において多くの魅力的な作品が作られています。しかし、私たちが知る限り、オブジェクトのバイナリ形式でコンテキスト情報を利用する方法についての研究はほとんどありません。本論文では、コンテキスト抽出モジュールをUNetアーキテクチャに統合し、スケルトンピクセルを抽出するネットワークの能力を効果的に向上させることができるコンテキストアテンションネットワーク(CANet)と呼ばれるアテンションベースのモデルを提案します。一方、特定のデータセットで良好な結果を達成するために、距離変換、重み焦点損失などのいくつかの新しい手法も使用します。最後に、モデルアンサンブルがなく、トレーニング画像が80%しかない場合、この方法では、開発フェーズで0.822 F1スコア、ピクセルSkelNetOnコンペティションの最終フェーズで0.8507 F1スコアを達成し、リーダーボードで1位にランクされます。
Skeleton extraction is a task focused on providing a simple representation of an object by extracting the skeleton from the given binary or RGB image. In recent years many attractive works in skeleton extraction have been made. But as far as we know, there is little research on how to utilize the context information in the binary shape of objects. In this paper, we propose an attention-based model called Context Attention Network (CANet), which integrates the context extraction module in a UNet architecture and can effectively improve the ability of network to extract the skeleton pixels. Meanwhile, we also use some novel techniques including distance transform, weight focal loss to achieve good results on the given dataset. Finally, without model ensemble and with only 80% of the training images, our method achieves 0.822 F1 score during the development phase and 0.8507 F1 score during the final phase of the Pixel SkelNetOn Competition, ranking 1st place on the leaderboard.
updated: Tue May 24 2022 13:34:13 GMT+0000 (UTC)
published: Tue May 24 2022 13:34:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト