arXiv reaDer
ShaDocNet: Transformer で文書の影を除去するための空間認識トークンを学習する
ShaDocNet: Learning Spatial-Aware Tokens in Transformer for Document Shadow Removal
影の除去により、ドキュメントのデジタル コピーの視覚的な品質と読みやすさが向上します。ただし、ドキュメントの影の除去は未解決の課題のままです。従来の手法は、状況によって異なるヒューリスティックに依存しています。現在公開されているデータセットの質と量を考慮すると、ニューラル ネットワーク モデルの大半は、このタスクを実行するには不十分です。この論文では、シャドウ領域とシャドウのない領域の両方でシャドウ コンテキストのエンコードとデコードを利用する、ドキュメントのシャドウ除去のための Transformer ベースのモデルを提案します。さらに、粗いものから細かいものへのプロセス全体に、影の検出とピクセルレベルの強調が含まれています。包括的なベンチマーク評価に基づいて、最先端の方法に匹敵します。
Shadow removal improves the visual quality and legibility of digital copies of documents. However, document shadow removal remains an unresolved subject. Traditional techniques rely on heuristics that vary from situation to situation. Given the quality and quantity of current public datasets, the majority of neural network models are ill-equipped for this task. In this paper, we propose a Transformer-based model for document shadow removal that utilizes shadow context encoding and decoding in both shadow and shadow-free regions. Additionally, shadow detection and pixel-level enhancement are included in the whole coarse-to-fine process. On the basis of comprehensive benchmark evaluations, it is competitive with state-of-the-art methods.
updated: Wed Feb 22 2023 01:29:11 GMT+0000 (UTC)
published: Wed Nov 30 2022 01:46:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト