２値ニューラルネットの進化的強化学習

２値ニューラルネットの進化的強化学習 - 倒立振子制御への応用

以前に報告した「ニューラルネットの進化的学習 - 倒立振子制御への応用」においては，ニューラルネットの結合重みが実数値であった．この結合重みを２値{-1,1}に置き換えて，進化的アルゴリズムによる強化学習を試みた．用いたアルゴリズムは「進化戦略アルゴリズム」と「遺伝的アルゴリズム」である．

進化戦略アルゴリズムの設定

遺伝的アルゴリズムの設定

進化戦略アルゴリズムを用いて学習させた２値ニューラルネットの性能評価値

遺伝的アルゴリズムを用いて学習させた２値ニューラルネットの性能評価値

学習曲線の例 - 進化戦略アルゴリズムの場合
　

　
学習曲線の例 - 遺伝的アルゴリズムの場合
　

　
学習後の２値ニューラルネットによる振り子の制御 - 進化戦略アルゴリズムの場合
　

　
学習後の２値ニューラルネットによる振り子の制御 - 遺伝的アルゴリズムの場合