３値ニューラルネットの進化的強化学習

３値ニューラルネットの進化的強化学習 - Atari Space Invadersへの応用

以前に報告した「２値ニューラルネットの進化的学習 - Atari Space Invadersへの応用」においては，ニューラルネットの結合重みが２値{-1,1}であった．本研究では，結合重みを３値{-1,0,1}に置き換えて，進化的アルゴリズムによる強化学習を試みた．用いたアルゴリズムは「進化戦略アルゴリズム」である．

進化戦略アルゴリズムの設定

進化戦略アルゴリズムを用いて学習させたニューラルネットが得たゲームスコア
(i)３値重み{-1,0,1} (ii)２値重み{-1,1}

学習曲線の例 - 進化戦略アルゴリズムの場合

学習前 の３値ニューラルネットによる連結チェーンの制御

学習後 の３値ニューラルネットによる連結チェーンの制御 - 進化戦略アルゴリズムの場合