arXiv reaDer
RarePlanes:合成データが飛躍する
RarePlanes: Synthetic Data Takes Flight
RarePlanesは、実際の衛星画像と合成衛星画像の両方を組み込んだ独自のオープンソースの機械学習データセットです。 RarePlanesデータセットは、合成データの価値に特に焦点を当てており、衛星画像で航空機とその属性を自動的に検出するコンピュータービジョンアルゴリズムを支援します。他の合成/実際の組み合わせデータセットが存在しますが、RarePlanesは、オーバーヘッドの観点から合成データの価値をテストするために構築された、公開されている最大の超高解像度データセットです。以前の調査では、合成データによって必要な実際のトレーニングデータの量が減り、コンピュータービジョンドメインの多くのタスクのパフォーマンスが向上する可能性があることが示されています。データセットの実際の部分は、112の場所と2,142 km ^ 2にまたがる253のMaxarWorldView-3衛星シーンと14,700の手動注釈付き航空機で構成されています。付随する合成データセットは、AI.Reverieのシミュレーションプラットフォームを介して生成され、約630,000の航空機注釈付きの総面積9331.2 km ^ 2をシミュレートする50,000の合成衛星画像を備えています。実際の航空機と合成で生成された航空機はどちらも、航空機の長さ、翼幅、翼の形状、翼の位置、翼幅のクラス、推進力、エンジンの数、垂直尾翼の数、カナードの存在、航空機の役割など、10の細かい属性を備えています。最後に、実際のデータセットと合成データセットを評価し、パフォーマンスを比較するために、広範な実験を実施します。そうすることで、航空機を頭上から検出して分類するタスクの合成データの価値を示します。
RarePlanes is a unique open-source machine learning dataset that incorporates both real and synthetically generated satellite imagery. The RarePlanes dataset specifically focuses on the value of synthetic data to aid computer vision algorithms in their ability to automatically detect aircraft and their attributes in satellite imagery. Although other synthetic/real combination datasets exist, RarePlanes is the largest openly-available very-high resolution dataset built to test the value of synthetic data from an overhead perspective. Previous research has shown that synthetic data can reduce the amount of real training data needed and potentially improve performance for many tasks in the computer vision domain. The real portion of the dataset consists of 253 Maxar WorldView-3 satellite scenes spanning 112 locations and 2,142 km^2 with 14,700 hand-annotated aircraft. The accompanying synthetic dataset is generated via AI.Reverie's simulation platform and features 50,000 synthetic satellite images simulating a total area of 9331.2 km^2 with ~630,000 aircraft annotations. Both the real and synthetically generated aircraft feature 10 fine grain attributes including: aircraft length, wingspan, wing-shape, wing-position, wingspan class, propulsion, number of engines, number of vertical-stabilizers, presence of canards, and aircraft role. Finally, we conduct extensive experiments to evaluate the real and synthetic datasets and compare performances. By doing so, we show the value of synthetic data for the task of detecting and classifying aircraft from an overhead perspective.
updated: Tue Nov 10 2020 17:17:01 GMT+0000 (UTC)
published: Thu Jun 04 2020 15:46:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト