arXiv reaDer
建物のファサード解析R-CNN
Building Facade Parsing R-CNN
建物のファサードのピクセルレベルのラベルを予測する建物のファサードの解析は、自動運転車(AV)運転のコンピュータービジョン認識に適用されます。ただし、AVの車載カメラは、正面からのビューではなく、カメラの視点により、AVが走行している道路の両側にある建物のファサードの変形したビューをキャプチャします。変形したファサードビューの解析を実行するために、transconvモジュール、一般化されたバウンディングボックス検出、および凸正則化を含むファサードR-CNNを提案します。実験は、ファサードR-CNNが、主に正面図用に開発された現在の最先端のファサード解析モデルよりも優れたパフォーマンスを実現することを示しています。また、OxfordRobotCarデータセットから派生した新しい建物ファサード解析データセットを公開しています。これをOxfordRobotCarファサードデータセットと呼びます。このデータセットには、建物のファサードオブジェクトの正確な注釈が追加されたOxfordRobotCarデータセットからの500のストリートビュー画像が含まれています。公開されたデータセットはhttps://github.com/sijieaaa/Oxford-RobotCar-Facadeで入手できます。
Building facade parsing, which predicts pixel-level labels for building facades, has applications in computer vision perception for autonomous vehicle (AV) driving. However, instead of a frontal view, an on-board camera of an AV captures a deformed view of the facade of the buildings on both sides of the road the AV is travelling on, due to the camera perspective. We propose Facade R-CNN, which includes a transconv module, generalized bounding box detection, and convex regularization, to perform parsing of deformed facade views. Experiments demonstrate that Facade R-CNN achieves better performance than the current state-of-the-art facade parsing models, which are primarily developed for frontal views. We also publish a new building facade parsing dataset derived from the Oxford RobotCar dataset, which we call the Oxford RobotCar Facade dataset. This dataset contains 500 street-view images from the Oxford RobotCar dataset augmented with accurate annotations of building facade objects. The published dataset is available at https://github.com/sijieaaa/Oxford-RobotCar-Facade
updated: Thu May 12 2022 07:08:45 GMT+0000 (UTC)
published: Thu May 12 2022 07:08:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト