arXiv reaDer
選択的リプレイは、オンラインの継続的な類推における学習を強化します
Selective Replay Enhances Learning in Online Continual Analogical Reasoning
継続学習では、システムは、壊滅的な忘却なしに、非定常データストリームまたはバッチから学習します。この問題は、教師あり画像分類と強化学習で徹底的に研究されてきましたが、抽象的な推論のために設計されたニューラルネットワークでの継続的な学習はまだ研究されていません。ここでは、類推の継続的な学習を研究します。 Raven's Progressive Matrices(RPM)などのアナログ推論テストは、人間の非言語的抽象推論を測定するために一般的に使用されており、最近、RPM問題のオフラインニューラルネットワークが提案されています。このホワイトペーパーでは、RPMで継続的な学習者を評価するために、実験的なベースライン、プロトコル、および順方向と逆方向の転送メトリックを確立します。私たちは、壊滅的な忘却を軽減するために経験リプレイを採用しています。画像分類タスクにリプレイを使用した以前の作業では、リプレイするサンプルを選択的に選択しても、ランダムな選択よりもメリットがほとんどないことがわかっています。対照的に、選択的再生は、RPMタスクのランダム選択よりも大幅に優れていることがわかります。
In continual learning, a system learns from non-stationary data streams or batches without catastrophic forgetting. While this problem has been heavily studied in supervised image classification and reinforcement learning, continual learning in neural networks designed for abstract reasoning has not yet been studied. Here, we study continual learning of analogical reasoning. Analogical reasoning tests such as Raven's Progressive Matrices (RPMs) are commonly used to measure non-verbal abstract reasoning in humans, and recently offline neural networks for the RPM problem have been proposed. In this paper, we establish experimental baselines, protocols, and forward and backward transfer metrics to evaluate continual learners on RPMs. We employ experience replay to mitigate catastrophic forgetting. Prior work using replay for image classification tasks has found that selectively choosing the samples to replay offers little, if any, benefit over random selection. In contrast, we find that selective replay can significantly outperform random selection for the RPM task.
updated: Mon Apr 19 2021 15:38:49 GMT+0000 (UTC)
published: Sat Mar 06 2021 00:04:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト