arXiv reaDer
リアルタイムで軽量な線分検出に向けて
Towards Real-time and Light-weight Line Segment Detection
以前の深層学習ベースの線分検出(LSD)は、巨大なモデルサイズと線予測の高い計算コストに悩まされていました。これにより、計算が制限された環境でのリアルタイムの推論が制限されます。この論文では、モバイルLSD(M-LSD)と呼ばれるリソースに制約のある環境向けのリアルタイムで軽量の線分検出器を提案します。バックボーンネットワークを最小限に抑え、以前の方法で見られたライン予測の一般的なマルチモジュールプロセスを削除することにより、非常に効率的なLSDアーキテクチャを設計します。軽量ネットワークで競争力のあるパフォーマンスを維持するために、新しいトレーニングスキームを提示します:線分のセグメント(SoL)の拡張、マッチング、および幾何学的損失。 SoL拡張は、ラインセグメントを複数のサブパートに分割します。これらのサブパートは、トレーニングプロセス中に補助ラインデータを提供するために使用されます。さらに、マッチングと幾何学的損失により、モデルは追加の幾何学的手がかりをキャプチャできます。以前は最高のリアルタイムLSDメソッドであったTP-LSD-Liteと比較して、私たちのモデル(M-LSD-tiny)は、モデルサイズの2.5%、GPUでの推論速度の130.5%の向上により、競争力のあるパフォーマンスを実現します。さらに、私たちのモデルは、最新のAndroidおよびiPhoneモバイルデバイスでそれぞれ56.8FPSおよび48.6FPSで動作します。私たちの知る限り、これはモバイルデバイスで利用できる最初のリアルタイムディープLSDです。私たちのコードが利用可能です。
Previous deep learning-based line segment detection (LSD) suffers from the immense model size and high computational cost for line prediction. This constrains them from real-time inference on computationally restricted environments. In this paper, we propose a real-time and light-weight line segment detector for resource-constrained environments named Mobile LSD (M-LSD). We design an extremely efficient LSD architecture by minimizing the backbone network and removing the typical multi-module process for line prediction found in previous methods. To maintain competitive performance with a light-weight network, we present novel training schemes: Segments of Line segment (SoL) augmentation, matching and geometric loss. SoL augmentation splits a line segment into multiple subparts, which are used to provide auxiliary line data during the training process. Moreover, the matching and geometric loss allow a model to capture additional geometric cues. Compared with TP-LSD-Lite, previously the best real-time LSD method, our model (M-LSD-tiny) achieves competitive performance with 2.5% of model size and an increase of 130.5% in inference speed on GPU. Furthermore, our model runs at 56.8 FPS and 48.6 FPS on the latest Android and iPhone mobile devices, respectively. To the best of our knowledge, this is the first real-time deep LSD available on mobile devices. Our code is available.
updated: Mon Feb 14 2022 12:22:59 GMT+0000 (UTC)
published: Tue Jun 01 2021 02:28:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト