Computer Analysis of Architecture Using Automatic Image Understanding
過去数年間、コンピュータービジョンとパターン認識システムはますます強力になり、マシンビジョンによって可能になる自動タスクの範囲が拡大しています。ここでは、建物の画像のコンピューター分析が建築の定量分析を実行し、都市の建築様式間の類似性を定量的に定量化できることを示します。 18の都市と3か国の建物の画像がGoogleストリートビューを使用して取得され、マシンビジョンシステムのトレーニングに使用され、画像の視覚的コンテンツに基づいて、画像化された建物の場所を自動的に識別しました。実験結果は、自動コンピュータ分析がストリートビュー画像の地理的位置を自動的に識別できることを示しています。さらに重要なことに、このアルゴリズムは都市と国をグループ化し、ストリートビュー画像でキャプチャされた建築スタイル間の類似性の系統を提供することができました。これらの結果は、コンピュータービジョンとパターン認識アルゴリズムが建物の画像を分析するという複雑な認知タスクを実行でき、異なるスタイルのアーキテクチャ間の視覚的な類似点と相違点を測定および定量化するために使用できることを示しています。この実験は、従来の手動による観察と分析を強化できる定量的アプローチに基づいて、アーキテクチャを研究するための新しいパラダイムを提供します。分析に使用されたソースコードは公開されており、公開されています。
In the past few years, computer vision and pattern recognition systems have been becoming increasingly more powerful, expanding the range of automatic tasks enabled by machine vision. Here we show that computer analysis of building images can perform quantitative analysis of architecture, and quantify similarities between city architectural styles in a quantitative fashion. Images of buildings from 18 cities and three countries were acquired using Google StreetView, and were used to train a machine vision system to automatically identify the location of the imaged building based on the image visual content. Experimental results show that the automatic computer analysis can automatically identify the geographical location of the StreetView image. More importantly, the algorithm was able to group the cities and countries and provide a phylogeny of the similarities between architectural styles as captured by StreetView images. These results demonstrate that computer vision and pattern recognition algorithms can perform the complex cognitive task of analyzing images of buildings, and can be used to measure and quantify visual similarities and differences between different styles of architectures. This experiment provides a new paradigm for studying architecture, based on a quantitative approach that can enhance the traditional manual observation and analysis. The source code used for the analysis is open and publicly available.
updated: Thu Jul 09 2020 16:31:32 GMT+0000 (UTC)
published: Fri Jul 13 2018 02:25:28 GMT+0000 (UTC)
