京都産業大学 > 情報理工学部
岡田英彦 (Hidehiko OKADA) ホーム > 研究テーマ
2値ニューラルネットの進化的強化学習 - 連結チェーン制御への応用

2値ニューラルネットの進化的強化学習 - 連結チェーン制御への応用

以前に報告した「ニューラルネットの進化的学習 - 連結チェーン制御への応用」においては,ニューラルネットの結合重みが実数値であった.この結合重みを2値{-1,1}に置き換えて,進化的アルゴリズムによる強化学習を試みた.用いたアルゴリズムは「進化戦略アルゴリズム」と「遺伝的アルゴリズム」である.


 

進化戦略アルゴリズムの設定


 

遺伝的アルゴリズムの設定


 

進化戦略アルゴリズムを用いて学習させた2値ニューラルネットの性能評価値


 

遺伝的アルゴリズムを用いて学習させた2値ニューラルネットの性能評価値


 

 
学習曲線の例 - 進化戦略アルゴリズムの場合
 

 
学習曲線の例 - 遺伝的アルゴリズムの場合
 

 
学習後の2値ニューラルネットによる連結チェーンの制御 - 進化戦略アルゴリズムの場合
 

 
学習後の2値ニューラルネットによる連結チェーンの制御 - 遺伝的アルゴリズムの場合