arXiv reaDer
TorMentor:決定論的動的パス、フラクタルによるデータ拡張
TorMentor: Deterministic dynamic-path, data augmentations with fractals
効率的なデータ拡張の手段としてフラクタルの使用を提案します。具体的には、グローバル画像増強変換を連続ローカル変換に適応させるためにプラズマフラクタルを採用しています。ダイアモンドスクエアアルゴリズムを単純な畳み込み演算のカスケードとして定式化し、GPUでのプラズマフラクタルの効率的な計算を可能にします。完全にモジュール化され、画像と点群全体で決定論的なTorMentor画像拡張フレームワークを紹介します。すべての画像拡張操作は、パイプライン化とランダム分岐によって組み合わせて、任意の幅と深さのフローネットワークを形成できます。 DIBCOデータセットを使用したドキュメント画像セグメンテーション(2値化)の実験で、提案されたアプローチの効率を示します。提案されたアプローチは、従来の画像増強技術よりも優れたパフォーマンスを示しています。最後に、自己監視連隊で拡張合成バイナリテキスト画像を使用し、限られたデータと単純な拡張でトレーニングした場合、同じモデルよりも優れています。
We propose the use of fractals as a means of efficient data augmentation. Specifically, we employ plasma fractals for adapting global image augmentation transformations into continuous local transforms. We formulate the diamond square algorithm as a cascade of simple convolution operations allowing efficient computation of plasma fractals on the GPU. We present the TorMentor image augmentation framework that is totally modular and deterministic across images and point-clouds. All image augmentation operations can be combined through pipelining and random branching to form flow networks of arbitrary width and depth. We demonstrate the efficiency of the proposed approach with experiments on document image segmentation (binarization) with the DIBCO datasets. The proposed approach demonstrates superior performance to traditional image augmentation techniques. Finally, we use extended synthetic binary text images in a self-supervision regiment and outperform the same model when trained with limited data and simple extensions.
updated: Thu Apr 07 2022 23:28:12 GMT+0000 (UTC)
published: Thu Apr 07 2022 23:28:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト