プロジェクトでは, 閾値のある公共財供給実験の被験者の行動を 強化学習で再現している. 閾値のある公共財供給ゲームは, オーストラリアと日本の中学生と 大学生を対象に行っている5人1組のゲームがある. このゲームは少なくとも過半数が協力する協力均衡と誰も協力しない 非協力均衡をもつが, これを同じグループに10回プレイさせると, 多くのばあい初回は協力均衡 (の近く) が実現するが徐々に非協力 均衡に向かって動いていく. 均衡が1つしかないゲームで被験者の行動がそこに向かって動いて いくのを計算機実験で再現すること (たとえば閾値のない公共財供給 ゲームは非協力均衡しかもたず, 被験者の行動も多くの場合その唯一 の均衡へ近づいていくが, それを強化学習で再現すること) は上記の 研究者たちによって行われているが, 複数の均衡があるときにある 均衡から別の均衡への移動を強化学習で再現することは, まだ十分な 成果を収めていない. これを独自の工夫で実現した点に, 当プロジェクト での研究成果の価値がある. さらに当プロジェクトは, 対戦相手を選べる繰返し囚人のジレンマ・ ゲームを独自の「信頼性モデル」でよく再現している. これは対戦相手 固定の囚人のジレンマ (2人とも協力すれば2人とも協力しないときより 両方とも得だが, 片方だけが協力しないと協力しなかった方が大きな 利益をあげ協力した方が損をする) に対戦相手の選択を導入するもので ある. 現実世界では所与の相手とどう対戦するか以上に誰を対戦相手に 選ぶか (誰に対戦相手に選ばれるか) が大切なことを思えば, 様々な 囚人のジレンマの一般 化のなかでも重要なものであるが, 対戦者の増加 か不確実性の導入などと比較するとまだあまり研究が進んでいない.
プロジェクトでは, 独占仲介業者と複占仲介業者の実験を, 売手と買手 をエージェントとして仲介業者を被験者として実験している. これらの研究は, (a) 人間行動の観点からは, エージェントと被験者の 相互作用が作る複雑な環境下で人間がいかに問題を単純化して自らの 行動規則を作るかを明らかにする点で興味ぶかく, (b) 経済理論の観点 からは, 価格と取引数量の決定過程を市場外の利他的調整者 (売手と 買手のために無報酬で均衡を発見するまで競売を繰りかえすワルラシアン ・オークショニア) ではなく市場内の利己的調整者 (破産のリスクを とって価格調整をする仲介業者) の行動に求めるマーケット・マイクロ ストラクチャー理論の検証としての意味をもち, (c) 経済実験としては, 経済実験のほとんどが実験者が取引を制御するシステムを作り被験者が そのなかで売手と買手を演じるものであるなかで逆に実験者が売手と 買手を作り被験者に調整役をさせる点で新しさをもつ.
以下では現実的応用を目指す研究の例として, リサイクル・システムの 設計の理論と実験を紹介する. これは 2001 年 4 月 1 日施行の「特定家庭用機器再商品化法」に おける企業の行動をモデル化するもので, 企業は生産したものを自分で 回収することを義務づけられている. 一見するとこの法律は企業に回収の負担を一方的にかけているように 思われるが, マーケット・マイクロストラクチャー理論の観点からは, 企業に中古製品を消費者から処理業者に引きわたす独占仲介業者として 振るまえることを保証している. じっさい理論分析をすると, 中古品の 回収が義務づけられていないときに比べると確かに企業の利益は減るが, 独占仲介業者として新たな利益機会を得るため, 回収を他者 (自治体 あるいは回収専業者あるいは消費者から回収業者への直接引渡し) に 任せるよりも企業の利益は大きいことを証明できる.
ただし, 独占企業がそのような行動 (生産量と価格の決定) を現実的な
不完全情報のもとでとるかは別問題なので, さまざまな場合の実験を
行っている.
たとえば実験では, 消費者 (使用ずみ耐久消費財の供給者) たちと
処理業者 (使用ずみ耐久消費財の需要者) たちはコンピュータ・
エージェントであり, 被験者2人が両者の仲介者を演じる.
この実験では, 生産者の仲介, 廃棄物専門取扱業者の仲介, 消費者と
仲介業者の直接取引の3つが可能なときの, 生産者と廃棄物専門取扱
業者を演じる2人の被験者の行動を調べる.
この設定では, 取引量と価格が理論値に速やかに収束する場合もあれば,
そうでないときもある.
このようにプロジェクトは, 理論が実現するかしないとすればその理由
はなにかを各々の場合について実験で確かめながら, リサイクル・
システムの研究を続けている.
図は, 上記の研究の扱っている体系からの脱出能力を説明するパズルで ある. いま人1と人2が白い帽子をかぶっている. 人1は人2が白い帽子を かぶっていることを知っているが, 人2は「人2が白い帽子をかぶっている かいないを人1は知っている」ことを知っている. ここで, あるひとが「君たちのうち少なくとも1人は白い帽子をかぶって います. 自分が白い帽子をかぶっているかいないか分りますか」と人1に 尋ねると, 人1は「分りません」と答えるが, その瞬間に人2は自分が 白い帽子をかぶっていることが分る. ここで人2は体系内推論 (人2の知識を推論規則に従って変形すること) をして「私は私が白い帽子をかぶっていることを知っている」を得るが, 人1はこのようにして「私は私が白い帽子をかぶっていることを知らない」 を得ることはできない. 人1は, 『私は「私が白い帽子をかぶっていることを私は知っている」 を演繹できない』というメタ定理を証明して, 「私は私が白い帽子を かぶっていることを知らない」と分る.
このメタ定理を厳密に証明し含意を検討したのが上述の研究の成果で あるが, 自分を含む体系について外から考察する能力は人間にとって 本質的であり, 人間なら誰でもシステムからの脱出を意識することなく 行う. いっぽうこれはエージェントにはできないことであり, 被験者の 行動とエージェントの行動の差の理由のひとつは, この点に求められる. じっさい被験者は, 平等や道徳などの概念を公平性が問題になる実験に もちこんだり, 探索や情報交換が重要な問題でゲーム外で獲得した常識 をゲーム内で利用する (情報伝達のために簡単なシンボルの送信 (チープ・トーク) の許されている実験での被験者のシンボルへの 意味づけとその計算機実験については現在研究中であるが, 各人が 二者択一問題を3200回くりかえすスモール・デシジョン実験でのゲーム の報酬に対する常識的期待の影響については, 藤川・小田の研究がある). システムからの脱出の観点から理論・被験者実験・計算機実験を 組み合わせて研究を進めるのは, プロジェクトの研究の特徴である.