arXiv reaDer
足場の学習:教育のためのモデル説明の最適化
Learning to Scaffold: Optimizing Model Explanations for Teaching
現代の機械学習モデルは不透明であり、その結果、これらのモデルの動作を説明する方法に関する学術的なサブフィールドが急成長しています。しかし、そのような説明を提供することの正確な目標は何ですか、そして説明がこの目標を達成することをどのように実証できますか?一部の研究では、説明は、説明されているモデルをシミュレートするように学生(人間または機械)に教えるのに役立つはずであり、説明の質は、説明されていない例での学生のシミュレーション精度によって測定できると主張しています。この作業では、メタ学習手法を活用して、このアイデアを拡張し、説明自体の品質を向上させます。具体的には、学生モデルが元のモデルのシミュレーションをより効果的に学習できるように説明を最適化します。 3つの自然言語処理とコンピュータービジョンタスクでモデルをトレーニングし、フレームワークで抽出された説明でトレーニングされた生徒は、以前の方法で作成されたものよりもはるかに効果的に教師をシミュレートできることがわかりました。人間の注釈とユーザー調査を通じて、これらの学習された説明は、人間がこれらのタスクで必要な決定を説明する方法とより密接に一致していることがさらにわかります。私たちのコードはhttps://github.com/coderpat/learning-scaffoldで入手できます
Modern machine learning models are opaque, and as a result there is a burgeoning academic subfield on methods that explain these models' behavior. However, what is the precise goal of providing such explanations, and how can we demonstrate that explanations achieve this goal? Some research argues that explanations should help teach a student (either human or machine) to simulate the model being explained, and that the quality of explanations can be measured by the simulation accuracy of students on unexplained examples. In this work, leveraging meta-learning techniques, we extend this idea to improve the quality of the explanations themselves, specifically by optimizing explanations such that student models more effectively learn to simulate the original model. We train models on three natural language processing and computer vision tasks, and find that students trained with explanations extracted with our framework are able to simulate the teacher significantly more effectively than ones produced with previous methods. Through human annotations and a user study, we further find that these learned explanations more closely align with how humans would explain the required decisions in these tasks. Our code is available at https://github.com/coderpat/learning-scaffold
updated: Fri Apr 22 2022 16:43:39 GMT+0000 (UTC)
published: Fri Apr 22 2022 16:43:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト