arXiv reaDer
deepNIR:ディープラーニング技術を使用して合成NIR画像と改良された果物検出システムを生成するためのデータセット
deepNIR: Datasets for generating synthetic NIR images and improved fruit detection system using deep learning techniques
この論文では、合成近赤外線(NIR)画像の生成とバウンディングボックスレベルの果物検出システムに利用されるデータセットを紹介します。 TensorflowやPytorchなどの高品質の機械学習フレームワーク、および高速化されたGPUハードウェアを利用した大規模なImageNetまたはCOCOデータセットが、数十年以上にわたって機械学習技術の限界を押し上げてきたことは否定できません。これらのブレークスルーの中で、高品質のデータセットは、モデルの一般化とデータ駆動型ディープニューラルネットワークの展開の成功につながる可能性のある重要な構成要素の1つです。特に、合成データ生成タスクでは、他の教師ありアプローチよりも多くのトレーニングサンプルが必要になることがよくあります。したがって、この論文では、2つの公開データセット(つまり、nirsceneとSEN12MS)から再処理されたNIR + RGBデータセットと、新しいNIR + RGBピーマン(トウガラシ)データセットを共有します。これらのNIR+RGBデータセットは、合成NIR画像の生成に使用するのに十分であることを定量的および定性的に示します。 nirscene1、SEN12MS、およびピーマンのデータセットについて、それぞれ11.36、26.53、および40.15のフレシェ開始距離(FID)を達成しました。さらに、クラウドサービスを使用してさまざまな形式でエクスポートできる11個のフルーツバウンディングボックスの手動注釈をリリースします。新しく追加された4つのフルーツ[ブルーベリー、チェリー、キウイ、小麦]は、deepFruitsプロジェクト[リンゴ、アボカド、トウガラシ、マンゴー、オレンジ、ロックメロン、イチゴ]で提示された以前の作業に加えて、11の新しいバウンディングボックスデータセットを合成します。データセットのバウンディングボックスインスタンスの総数は162kであり、クラウドサービスから使用する準備ができています。データセットの評価には、Yolov5シングルステージ検出器が利用され、[最小:0.49、最大:0.812]の印象的な平均平均精度、mAP [0.5:0.95]の結果が報告されます。これらのデータセットが有用であり、将来の研究のベースラインとして役立つことを願っています。
This paper presents datasets utilised for synthetic near-infrared (NIR) image generation and bounding-box level fruit detection systems. It is undeniable that high-calibre machine learning frameworks such as Tensorflow or Pytorch, and large-scale ImageNet or COCO datasets with the aid of accelerated GPU hardware have pushed the limit of machine learning techniques for more than decades. Among these breakthroughs, a high-quality dataset is one of the essential building blocks that can lead to success in model generalisation and the deployment of data-driven deep neural networks. In particular, synthetic data generation tasks often require more training samples than other supervised approaches. Therefore, in this paper, we share the NIR+RGB datasets that are re-processed from two public datasets (i.e., nirscene and SEN12MS) and our novel NIR+RGB sweet pepper(capsicum) dataset. We quantitatively and qualitatively demonstrate that these NIR+RGB datasets are sufficient to be used for synthetic NIR image generation. We achieved Frechet Inception Distance (FID) of 11.36, 26.53, and 40.15 for nirscene1, SEN12MS, and sweet pepper datasets respectively. In addition, we release manual annotations of 11 fruit bounding boxes that can be exported as various formats using cloud service. Four newly added fruits [blueberry, cherry, kiwi, and wheat] compound 11 novel bounding box datasets on top of our previous work presented in the deepFruits project [apple, avocado, capsicum, mango, orange, rockmelon, strawberry]. The total number of bounding box instances of the dataset is 162k and it is ready to use from cloud service. For the evaluation of the dataset, Yolov5 single stage detector is exploited and reported impressive mean-average-precision,mAP[0.5:0.95] results of[min:0.49, max:0.812]. We hope these datasets are useful and serve as a baseline for the future studies.
updated: Thu Mar 17 2022 05:25:36 GMT+0000 (UTC)
published: Thu Mar 17 2022 05:25:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト