路面の損傷検出に関する研究は研究の活発な分野でしたが、ほとんどの研究はこれまで損傷の存在の検出に焦点を合わせてきました。ただし、実際のシナリオでは、事前に効果的なアクションを実行したり、必要なリソースを割り当てるために、道路管理者は損傷の種類とその程度を明確に理解する必要があります。さらに、現在、均一で公然と利用可能な道路損傷データセットはほとんどなく、道路損傷検出のための共通のベンチマークが不足しています。このようなデータセットは、さまざまなアプリケーションで使用できます。ここでは、政府機関が計画目的で、またはインフラストラクチャ保守会社が支援できる物理的資産管理ツールの取得コンポーネントとして機能することを意図しています。このペーパーでは、これらの問題に対処するために2つの貢献をします。最初に、よりバランスの取れた代表的な損害のセットを含む大規模な道路損害データセットを提示します。このデータセットは、スマートフォンでキャプチャされた18,034の道路損傷画像で構成され、45,435のインスタンスの路面損傷があります。次に、従来型(LBPカスケード分類器)と深層学習ベース、具体的にはMobileNetとRetinaNetの両方のさまざまなタイプのオブジェクト検出方法をトレーニングしました。これらは、組み込みおよびモバイル、および多くのアプリケーションで受け入れ可能なパフォーマンスを備えた実装に適しています。これらすべてのモデルの精度と推論時間を、最新技術のその他のモデルと比較します。
Research on damage detection of road surfaces has been an active area of re-search, but most studies have focused so far on the detection of the presence of damages. However, in real-world scenarios, road managers need to clearly understand the type of damage and its extent in order to take effective action in advance or to allocate the necessary resources. Moreover, currently there are few uniform and openly available road damage datasets, leading to a lack of a common benchmark for road damage detection. Such dataset could be used in a great variety of applications; herein, it is intended to serve as the acquisition component of a physical asset management tool which can aid governments agencies for planning purposes, or by infrastructure mainte-nance companies. In this paper, we make two contributions to address these issues. First, we present a large-scale road damage dataset, which includes a more balanced and representative set of damages. This dataset is composed of 18,034 road damage images captured with a smartphone, with 45,435 in-stances road surface damages. Second, we trained different types of object detection methods, both traditional (an LBP-cascaded classifier) and deep learning-based, specifically, MobileNet and RetinaNet, which are amenable for embedded and mobile and implementations with an acceptable perfor-mance for many applications. We compare the accuracy and inference time of all these models with others in the state of the art.