arXiv reaDer
オンライン不一致遠隔学習によるタスクフリーの継続的学習
Task-Free Continual Learning via Online Discrepancy Distance Learning
タスクフリー継続学習 (TFCL) とも呼ばれる非定常データ ストリームからの学習は、明示的なタスク情報がないため、依然として困難です。最近、TFCL に対していくつかの方法が提案されていますが、理論的な保証はありません。さらに、TFCL 中の忘却分析は、これまで理論的に研究されていませんでした。この論文では、訪問したサンプルとモデルのトレーニングに利用できるようになった情報全体との間の不一致距離に基づいて、一般化の境界を提供する新しい理論的分析フレームワークを開発します。この分析により、分類タスクにおける忘却行動に新しい洞察が得られます。この理論モデルに着想を得て、混合モデルの動的コンポーネント拡張メカニズム、つまりオンライン不一致距離学習 (ODDL) によって可能になる新しいアプローチを提案します。 ODDL は、現在のメモリ バッファーの確率論的表現と既に蓄積された知識との間の不一致を推定し、それを拡張信号として使用して、最適なパフォーマンスを備えたコンパクトなネットワーク アーキテクチャを保証します。次に、不一致ベースの測定によって最も関連性の高いサンプルをメモリ バッファーに選択的に保存し、パフォーマンスをさらに向上させる新しいサンプル選択アプローチを提案します。提案された方法論を使用していくつかのTFCL実験を実行し、提案されたアプローチが最先端のパフォーマンスを達成することを示しています。
Learning from non-stationary data streams, also called Task-Free Continual Learning (TFCL) remains challenging due to the absence of explicit task information. Although recently some methods have been proposed for TFCL, they lack theoretical guarantees. Moreover, forgetting analysis during TFCL was not studied theoretically before. This paper develops a new theoretical analysis framework which provides generalization bounds based on the discrepancy distance between the visited samples and the entire information made available for training the model. This analysis gives new insights into the forgetting behaviour in classification tasks. Inspired by this theoretical model, we propose a new approach enabled by the dynamic component expansion mechanism for a mixture model, namely the Online Discrepancy Distance Learning (ODDL). ODDL estimates the discrepancy between the probabilistic representation of the current memory buffer and the already accumulated knowledge and uses it as the expansion signal to ensure a compact network architecture with optimal performance. We then propose a new sample selection approach that selectively stores the most relevant samples into the memory buffer through the discrepancy-based measure, further improving the performance. We perform several TFCL experiments with the proposed methodology, which demonstrate that the proposed approach achieves the state of the art performance.
updated: Wed Oct 12 2022 20:44:09 GMT+0000 (UTC)
published: Wed Oct 12 2022 20:44:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト