画像またはビデオ操作へのコンピュータービジョンの多くの成功したアプリケーションは、本質的にインタラクティブです。ただし、このようなシステムのパラメーターは、多くの場合、ユーザーを無視して訓練されます。従来、対話型システムは、完全に自動化された対応システムと同じ方法で扱われてきました。それらのパフォーマンスは、一定のユーザーインタラクションセットの下でソリューションの精度を計算することによって評価されます。この論文では、ユーザーをループに導く新しい評価および学習方法を提案します。これは、アクティブなロボットユーザー(人間のユーザーのシミュレーションモデル)の使用に基づいています。このアプローチを使用して、最先端のインタラクティブなセグメンテーションシステムのパラメーターを評価および学習する方法を示します。また、シミュレートされたユーザーモデルをパラメーター学習のための一般的な最大マージンメソッドに統合する方法を示し、結果の最適化問題を解決するアルゴリズムを提案します。
Many successful applications of computer vision to image or video manipulation are interactive by nature. However, parameters of such systems are often trained neglecting the user. Traditionally, interactive systems have been treated in the same manner as their fully automatic counterparts. Their performance is evaluated by computing the accuracy of their solutions under some fixed set of user interactions. This paper proposes a new evaluation and learning method which brings the user in the loop. It is based on the use of an active robot user - a simulated model of a human user. We show how this approach can be used to evaluate and learn parameters of state-of-the-art interactive segmentation systems. We also show how simulated user models can be integrated into the popular max-margin method for parameter learning and propose an algorithm to solve the resulting optimisation problem.