arXiv reaDer
Transformer Prediction Head に基づく改善された YOLOv5 を備えたコンピューター ビジョン対応の損傷検出モデル
A Computer Vision Enabled damage detection model with improved YOLOv5 based on Transformer Prediction Head
目的: コンピュータ ビジョンに基づく最新の正確な損傷の分類と位置特定は、インフラストラクチャの監視、安全性、および土木インフラストラクチャの有用性にとって決定的に重要です。ただし、現在の最先端の深層学習 (DL) ベースの損傷検出モデルは、複雑でノイズの多い環境では優れた特徴抽出機能を欠いていることが多く、正確で信頼性の高いオブジェクト識別の開発が制限されています。方法: この目的のために、重要な機能情報の保存と再利用を改善するために、DenseNet ブロックがバックボーンと統合された、リアルタイムの DL ベースの高性能損傷検出モデルである DenseSPH-YOLOv5 を提示します。さらに、畳み込みブロック アテンション モジュール (CBAM) が実装されており、さまざまな困難な環境下で優れた検出を実現する、強力で識別力のある深い空間特徴抽出のアテンション パフォーマンス メカニズムが改善されています。さらに、追加の機能融合レイヤーと Swin-Transformer Prediction Head (SPH) が追加され、高度なセルフアテンション メカニズムを活用して、マルチスケール オブジェクト サイズをより効率的に検出し、同時に計算の複雑さを軽減しています。結果: 大規模な道路損傷データセット (RDD-2018) でモデルのパフォーマンスを評価すると、62.4 FPS の検出率で、DenseSPH-YOLOv5 は 85.25 % の平均精度 (mAP) 値、81.18 % の F1 スコアを取得します。精度 (P) 値は 89.51 % で、現在の最先端モデルよりも優れています。重要性: 本研究は、非常に正確なローカライズされたバウンディング ボックス予測を提供することにより、既存の DL ベースの損傷検出モデルの欠点に対処する効果的かつ効率的な損傷ローカリゼーション モデルを提供します。現在の作業は、リアルタイムの現場アプリケーションにおける正確で堅牢な自動損傷検出システムへの一歩を構成します。
Objective:Computer vision-based up-to-date accurate damage classification and localization are of decisive importance for infrastructure monitoring, safety, and the serviceability of civil infrastructure. Current state-of-the-art deep learning (DL)-based damage detection models, however, often lack superior feature extraction capability in complex and noisy environments, limiting the development of accurate and reliable object distinction. Method: To this end, we present DenseSPH-YOLOv5, a real-time DL-based high-performance damage detection model where DenseNet blocks have been integrated with the backbone to improve in preserving and reusing critical feature information. Additionally, convolutional block attention modules (CBAM) have been implemented to improve attention performance mechanisms for strong and discriminating deep spatial feature extraction that results in superior detection under various challenging environments. Moreover, additional feature fusion layers and a Swin-Transformer Prediction Head (SPH) have been added leveraging advanced self-attention mechanism for more efficient detection of multiscale object sizes and simultaneously reducing the computational complexity. Results: Evaluating the model performance in large-scale Road Damage Dataset (RDD-2018), at a detection rate of 62.4 FPS, DenseSPH-YOLOv5 obtains a mean average precision (mAP) value of 85.25 %, F1-score of 81.18 %, and precision (P) value of 89.51 % outperforming current state-of-the-art models. Significance: The present research provides an effective and efficient damage localization model addressing the shortcoming of existing DL-based damage detection models by providing highly accurate localized bounding box prediction. Current work constitutes a step towards an accurate and robust automated damage detection system in real-time in-field applications.
updated: Tue Mar 07 2023 22:53:36 GMT+0000 (UTC)
published: Tue Mar 07 2023 22:53:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト