arXiv reaDer
VAE を使用した自動運転のための高速かつ効率的なシーン分類
Fast and Efficient Scene Categorization for Autonomous Driving using VAEs
シーンの分類は、コンテンツ ベースの画像のインデックス作成および検索システムでの幅広いアプリケーションを使用して、多くの高度なコンピューター ビジョン タスクに関する事前知識を提供する便利な先行タスクです。オブジェクト検出、セマンティック セグメンテーションなどのコンピューター ビジョンの分野におけるデータ駆動型アプローチの成功にもかかわらず、シーン認識のための高レベル機能の学習におけるそれらのアプリケーションは、同じレベルの成功を達成していません。画像から大まかな特徴をキャプチャし、分類ヘッドを使用して記述子を 3 つのシーン カテゴリ (農村、都市、郊外) にマッピングする、高速で効率的な中間の解釈可能な一般化されたグローバル記述子を生成することを提案します。教師なしで変分オートエンコーダーをトレーニングし、画像を制約付きの多次元潜在空間にマッピングし、潜在ベクトルを画像のグローバル記述子として機能するコンパクトな埋め込みとして使用します。実験結果は、VAE潜在ベクトルが画像から粗い情報をキャプチャし、グローバル記述子としての使用をサポートしていることを証明しています。提案されたグローバル記述子は、埋め込み長が 128 と非常にコンパクトで、計算が大幅に高速であり、シーンの分類に必要な十分なシーン情報をキャプチャしながら、季節や照明の変化に対して堅牢です。
Scene categorization is a useful precursor task that provides prior knowledge for many advanced computer vision tasks with a broad range of applications in content-based image indexing and retrieval systems. Despite the success of data driven approaches in the field of computer vision such as object detection, semantic segmentation, etc., their application in learning high-level features for scene recognition has not achieved the same level of success. We propose to generate a fast and efficient intermediate interpretable generalized global descriptor that captures coarse features from the image and use a classification head to map the descriptors to 3 scene categories: Rural, Urban and Suburban. We train a Variational Autoencoder in an unsupervised manner and map images to a constrained multi-dimensional latent space and use the latent vectors as compact embeddings that serve as global descriptors for images. The experimental results evidence that the VAE latent vectors capture coarse information from the image, supporting their usage as global descriptors. The proposed global descriptor is very compact with an embedding length of 128, significantly faster to compute, and is robust to seasonal and illuminational changes, while capturing sufficient scene information required for scene categorization.
updated: Wed Oct 26 2022 18:50:15 GMT+0000 (UTC)
published: Wed Oct 26 2022 18:50:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト