複数インスタンス学習 (MIL) は、インスタンスのバッグ全体に 1 つのラベルが割り当てられる弱い教師付き問題です。 MIL モデルの重要なクラスはインスタンスベースであり、最初にインスタンスを分類し、次にそれらの予測を集計してバッグラベルを取得します。最も一般的な MIL モデルは、バッグのインスタンスの少なくとも 1 つに肯定的なラベルが付いている場合に、そのバッグを肯定的なものと見なすモデルです。ただし、この推論は、多くの現実のシナリオでは当てはまりません。多くの場合、肯定的なバッグのラベルは、一定の割合の肯定的な事例の結果であるためです。この問題に対処するために、ディープ ニューラル ネットワークとバーンスタイン多項式推定に基づいた、ProMIL と呼ばれる専用のインスタンス ベースの手法を導入します。 ProMIL の重要な利点は、意思決定に最適なパーセンテージ レベルを自動的に検出できることです。実際の医療アプリケーションでは、ProMIL が標準のインスタンスベースの MIL よりも優れたパフォーマンスを発揮することを示します。コードを利用できるようにします。
Multiple Instance Learning (MIL) is a weakly-supervised problem in which one label is assigned to the whole bag of instances. An important class of MIL models is instance-based, where we first classify instances and then aggregate those predictions to obtain a bag label. The most common MIL model is when we consider a bag as positive if at least one of its instances has a positive label. However, this reasoning does not hold in many real-life scenarios, where the positive bag label is often a consequence of a certain percentage of positive instances. To address this issue, we introduce a dedicated instance-based method called ProMIL, based on deep neural networks and Bernstein polynomial estimation. An important advantage of ProMIL is that it can automatically detect the optimal percentage level for decision-making. We show that ProMIL outperforms standard instance-based MIL in real-world medical applications. We make the code available.