マルチギガピクセルの全スライド画像 (WSI) で動作する画像解析および機械学習アルゴリズムは、多くの場合、多数のタイル (サブ画像) を処理し、WSI レベルのラベルを予測するためにタイルから予測を集約する必要があります。この論文では、計算病理学 (CPath) の分野における将来の研究を導くのに役立つように、さまざまなタイプの集計方法に関する既存の文献のレビューを提示します。複数のレベルとタイプのデータ、および予測モデリングのために WSI を分析するための計算の性質を考慮する 3 つの経路を持つ一般的な CPath ワークフローを提案します。集計方法は、データのコンテキストと表現、計算モジュールの機能、および CPath のユース ケースに従って分類されます。複数インスタンス学習の原理に基づいたさまざまな方法を比較対照します。これはおそらく最も一般的に使用される集約方法であり、幅広い CPath 文献をカバーしています。公平な比較を行うために、特定の WSI レベルの予測タスクを検討し、そのタスクのさまざまな集計方法を比較します。最後に、一般的な集計方法の目的と望ましい属性、さまざまなアプローチの長所と短所、いくつかの推奨事項、および考えられる将来の方向性のリストで締めくくります。
Image analysis and machine learning algorithms operating on multi-gigapixel whole-slide images (WSIs) often process a large number of tiles (sub-images) and require aggregating predictions from the tiles in order to predict WSI-level labels. In this paper, we present a review of existing literature on various types of aggregation methods with a view to help guide future research in the area of computational pathology (CPath). We propose a general CPath workflow with three pathways that consider multiple levels and types of data and the nature of computation to analyse WSIs for predictive modelling. We categorize aggregation methods according to the context and representation of the data, features of computational modules and CPath use cases. We compare and contrast different methods based on the principle of multiple instance learning, perhaps the most commonly used aggregation method, covering a wide range of CPath literature. To provide a fair comparison, we consider a specific WSI-level prediction task and compare various aggregation methods for that task. Finally, we conclude with a list of objectives and desirable attributes of aggregation methods in general, pros and cons of the various approaches, some recommendations and possible future directions.