arXiv reaDer
生物医学画像分析競技のランキングを慎重に解釈する必要がある理由
Why rankings of biomedical image analysis competitions should be interpreted with care
  国際的な課題が生物医学画像解析法の検証の標準となっています。科学的な影響を考えると、課題の組織化に関連する一般的な慣行の重要な分析がまだ行われていないのは驚くべきことです。このホワイトペーパーでは、これまでに行われた生物医学画像解析の課題の包括的な分析を紹介します。課題の重要性を示し、品質管理の欠如が重大な結果をもたらすことを示します。まず、通常、関連情報の一部のみが提供されるため、結果の再現性と解釈が妨げられることがよくあります。第二に、アルゴリズムのランクは一般に、検証に使用されるテストデータ、適用されるランキングスキーム、参照アノテーションを作成するオブザーバーなどの多くの変数に対してロバストではありません。これらの問題を克服するために、ベストプラクティスガイドラインを推奨し、今後取り組むべき未解決の研究質問を定義します。
International challenges have become the standard for validation of biomedical image analysis methods. Given their scientific impact, it is surprising that a critical analysis of common practices related to the organization of challenges has not yet been performed. In this paper, we present a comprehensive analysis of biomedical image analysis challenges conducted up to now. We demonstrate the importance of challenges and show that the lack of quality control has critical consequences. First, reproducibility and interpretation of the results is often hampered as only a fraction of relevant information is typically provided. Second, the rank of an algorithm is generally not robust to a number of variables such as the test data used for validation, the ranking scheme applied and the observers that make the reference annotations. To overcome these problems, we recommend best practice guidelines and define open research questions to be addressed in the future.
updated: Wed Sep 18 2019 11:32:07 GMT+0000 (UTC)
published: Wed Jun 06 2018 08:13:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト