京都産業大学 > 情報理工学部
岡田英彦 (Hidehiko OKADA) ホーム > 研究テーマ
3値ニューラルネットの進化的強化学習 - Atari Space Invadersへの応用

3値ニューラルネットの進化的強化学習 - Atari Space Invadersへの応用

以前に報告した「2値ニューラルネットの進化的学習 - Atari Space Invadersへの応用」においては,ニューラルネットの結合重みが2値{-1,1}であった.本研究では,結合重みを3値{-1,0,1}に置き換えて,進化的アルゴリズムによる強化学習を試みた.用いたアルゴリズムは「進化戦略アルゴリズム」である.


 

進化戦略アルゴリズムの設定


 

進化戦略アルゴリズムを用いて学習させたニューラルネットが得たゲームスコア
(i)3値重み{-1,0,1} (ii)2値重み{-1,1}


 

 

学習曲線の例 - 進化戦略アルゴリズムの場合


 

 

学習前 の3値ニューラルネットによる連結チェーンの制御


 

 

学習後 の3値ニューラルネットによる連結チェーンの制御 - 進化戦略アルゴリズムの場合