arXiv reaDer
CNN を使用した切り替え可能な軽量反対称処理 (SLAP) によるサンプル サイズの削減と学習の高速化 -- 五目並べ強化学習への応用
Switchable Lightweight Anti-symmetric Processing (SLAP) with CNN to Reduce Sample Size and Speed up Learning -- Application in Gomoku Reinforcement Learning
データ増強に代わるものとして、この論文ではSLAPと呼ばれる経験を強化して機械学習を高速化し、サンプルサイズを縮小する方法を提案しました。 SLAP は、モデルに依存しないプロトコル/機能であり、異なる変換バリアントを指定して同じ出力を生成します。 SLAP は、五目並べゲーム状態の実験で畳み込みニューラル ネットワーク学習の収束速度を 83% 向上させ、データ拡張と比較してサンプル サイズはわずか 8 分の 1 でした。五目並べの強化学習では、AlphaGo Zero/AlphaZero アルゴリズムをベースラインとしてデータ拡張を使用して使用すると、SLAP はトレーニング サンプルの数を 8 分の 1 に減らし、同じ評価者に対して同様の勝率を達成しましたが、高速化できるかどうかはまだ明らかではありませんでした。強化学習をアップします。利点は、対称性または特定の変換に対して不変であるドメインに少なくとも適用されるはずです。将来の作業として、SLAP は、人工的な汎用知能への小さな一歩として、より説明可能な学習を支援し、対称性に対して不変ではないドメインの転移学習を支援する可能性があります。
To replace data augmentation, this paper proposed a method called SLAP to intensify experience to speed up machine learning and reduce the sample size. SLAP is a model-independent protocol/function to produce the same output given different transformation variants. SLAP improved the convergence speed of convolutional neural network learning by 83% in the experiments with Gomoku game states, with only one eighth of the sample size compared with data augmentation. In reinforcement learning for Gomoku, using AlphaGo Zero/AlphaZero algorithm with data augmentation as baseline, SLAP reduced the number of training samples by a factor of 8 and achieved similar winning rate against the same evaluator, but it was not yet evident that it could speed up reinforcement learning. The benefits should at least apply to domains that are invariant to symmetry or certain transformations. As future work, SLAP may aid more explainable learning and transfer learning for domains that are not invariant to symmetry, as a small step towards artificial general intelligence.
updated: Sun Jan 15 2023 07:20:14 GMT+0000 (UTC)
published: Wed Jan 11 2023 22:55:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト