arXiv reaDer
視覚認識のための永続的ホモロジーの再考
Rethinking Persistent Homology for Visual Recognition
画像の永続的な位相特性は、従来のニューラルネットワークでは発見できない可能性のある洞察を提供する追加の記述子として機能します。この分野の既存の研究は、パフォーマンスを向上させるために、学習プロセスでデータの位相特性を効率的に統合することに主に焦点を当てています。ただし、トポロジカルプロパティを導入するとパフォーマンスが向上または低下する可能性があるすべてのシナリオを実証する既存の研究はありません。このホワイトペーパーでは、トレーニングサンプルの数、トレーニングデータの複雑さ、バックボーンネットワークの複雑さによって定義される、さまざまなトレーニングシナリオでの画像分類のトポロジプロパティの有効性の詳細な分析を実行します。トポロジ機能から最も恩恵を受けるシナリオを特定します。たとえば、小さなデータセットで単純なネットワークをトレーニングします。さらに、データセットのトポロジの一貫性の問題について説明します。これは、分類にトポロジの特徴を使用する際の主要なボトルネックの1つです。さらに、トポロジの不一致が特定のシナリオのパフォーマンスにどのように悪影響を与える可能性があるかを示します。
Persistent topological properties of an image serve as an additional descriptor providing an insight that might not be discovered by traditional neural networks. The existing research in this area focuses primarily on efficiently integrating topological properties of the data in the learning process in order to enhance the performance. However, there is no existing study to demonstrate all possible scenarios where introducing topological properties can boost or harm the performance. This paper performs a detailed analysis of the effectiveness of topological properties for image classification in various training scenarios, defined by: the number of training samples, the complexity of the training data and the complexity of the backbone network. We identify the scenarios that benefit the most from topological features, e.g., training simple networks on small datasets. Additionally, we discuss the problem of topological consistency of the datasets which is one of the major bottlenecks for using topological features for classification. We further demonstrate how the topological inconsistency can harm the performance for certain scenarios.
updated: Sat Jul 09 2022 08:01:11 GMT+0000 (UTC)
published: Sat Jul 09 2022 08:01:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト