arXiv reaDer
メトリクスのリロード: 画像分析検証の推奨事項
Metrics reloaded: Recommendations for image analysis validation
機械学習 (ML) アルゴリズムの検証における欠陥が過小評価されている世界的な問題であることを示す証拠が増えています。特に自動生物医学画像解析では、選択されたパフォーマンス指標が分野の関心を反映していないことが多く、そのため科学の進歩を適切に測定できず、ML 技術の実用化が妨げられています。これを克服するために、私たちの大規模な国際専門家コンソーシアムは、研究者が問題を意識したメトリクスの選択をガイドする包括的なフレームワークである Metrics Reloaded を作成しました。アプリケーション ドメイン全体での ML 手法の収束に続き、Metrics Reloaded は検証手法の収束を促進します。このフレームワークは、複数段階の Delphi プロセスで開発され、問題のフィンガープリントという新しい概念に基づいています。これは、ドメインの関心からプロパティのプロパティに至るまで、メトリックの選択に関連するすべての側面を捉える、特定の問題の構造化された表現です。ターゲット構造、データセット、アルゴリズム出力。問題のフィンガープリントに基づいて、ユーザーは潜在的な落とし穴を認識しながら、適切な検証メトリクスを選択して適用するプロセスをガイドされます。 Metrics Reloaded は、画像、オブジェクト、またはピクセル レベルでの分類タスク、つまり画像レベルの分類、オブジェクト検出、セマンティック セグメンテーション、およびインスタンス セグメンテーション タスクとして解釈できる画像分析の問題を対象としています。ユーザー エクスペリエンスを向上させるために、Metrics Reloaded オンライン ツールにフレームワークを実装しました。これは、最も一般的な検証メトリクスの弱点、長所、および具体的な推奨事項を調査するためのアクセス ポイントも提供します。私たちのフレームワークがドメイン全体に幅広く適用できることは、さまざまな生物学的および医療画像分析のユースケースのインスタンス化によって実証されています。
Increasing evidence shows that flaws in machine learning (ML) algorithm validation are an underestimated global problem. Particularly in automatic biomedical image analysis, chosen performance metrics often do not reflect the domain interest, thus failing to adequately measure scientific progress and hindering translation of ML techniques into practice. To overcome this, our large international expert consortium created Metrics Reloaded, a comprehensive framework guiding researchers in the problem-aware selection of metrics. Following the convergence of ML methodology across application domains, Metrics Reloaded fosters the convergence of validation methodology. The framework was developed in a multi-stage Delphi process and is based on the novel concept of a problem fingerprint - a structured representation of the given problem that captures all aspects that are relevant for metric selection, from the domain interest to the properties of the target structure(s), data set and algorithm output. Based on the problem fingerprint, users are guided through the process of choosing and applying appropriate validation metrics while being made aware of potential pitfalls. Metrics Reloaded targets image analysis problems that can be interpreted as a classification task at image, object or pixel level, namely image-level classification, object detection, semantic segmentation, and instance segmentation tasks. To improve the user experience, we implemented the framework in the Metrics Reloaded online tool, which also provides a point of access to explore weaknesses, strengths and specific recommendations for the most common validation metrics. The broad applicability of our framework across domains is demonstrated by an instantiation for various biological and medical image analysis use cases.
updated: Fri Feb 23 2024 13:05:20 GMT+0000 (UTC)
published: Fri Jun 03 2022 15:56:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト