本論文では、弱監視型学習ベースのクラスタリングフレームワークを提案します。このフレームワークのコアとして、ユニーククラスカウント(ucc)と呼ばれるバッグレベルラベルに基づく新しい複数インスタンス学習タスクを導入します。これは、バッグ内のすべてのインスタンスのユニーククラスの数です。このタスクでは、モデルのトレーニング中にバッグ内の個々のインスタンスに注釈を付ける必要はありません。完全なucc分類器を使用すると、トレーニング中に個々のインスタンスに注釈が与えられていない場合でも、バッグ内の個々のインスタンスの完全なクラスタリングが可能であることが数学的に証明されます。ニューラルネットワークベースのucc分類器を構築し、弱教師付きucc分類器を使用したフレームワークのクラスタリングパフォーマンスが、すべてのインスタンスのラベルが既知の完全な教師あり学習モデルのクラスタリングパフォーマンスに匹敵することを実験的に示しました。さらに、組織学的リンパ節セクションの乳癌転移のセマンティックセグメンテーションの実世界のタスクへのフレームワークの適用性をテストし、弱く監視されたフレームワークのパフォーマンスが完全に監視されたUnetモデルのパフォーマンスに匹敵することを示しました。
A weakly supervised learning based clustering framework is proposed in this paper. As the core of this framework, we introduce a novel multiple instance learning task based on a bag level label called unique class count (ucc), which is the number of unique classes among all instances inside the bag. In this task, no annotations on individual instances inside the bag are needed during training of the models. We mathematically prove that with a perfect ucc classifier, perfect clustering of individual instances inside the bags is possible even when no annotations on individual instances are given during training. We have constructed a neural network based ucc classifier and experimentally shown that the clustering performance of our framework with our weakly supervised ucc classifier is comparable to that of fully supervised learning models where labels for all instances are known. Furthermore, we have tested the applicability of our framework to a real world task of semantic segmentation of breast cancer metastases in histological lymph node sections and shown that the performance of our weakly supervised framework is comparable to the performance of a fully supervised Unet model.