進化ゲーム

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

進化ゲーム(しんかげーむ、進化ゲーム理論)とは、非協力ゲーム理論を動学化した理論体系である。

非協力ゲーム理論はナッシュ均衡という均衡概念を用いて分析を行う静学的な理論体系であるが、進化ゲーム理論は戦略分布や戦略プロファイルで表現される社会状態の変化を分析の対象とする動学的な体系である。プレーヤの出生死滅で集団中の戦略分布が変化することを想定するレプリケータダイナミクスモデルや、プレーヤの学習によって戦略分布や戦略プロファイルが変化する学習ダイナミクスモデルが考えられている。

概要[編集]

たとえば、次のチキンゲームを考えてみよう。

1・2 A B
A 1,1 -2,5
B 5,-2 -8,-8

このゲームのナッシュ均衡は、<1がAで2がB>、<1がBで2がA>、<1と2がそれぞれ確率0.6でA、確率0.4でBをとる>の3通りである。いずれかの状態からプレーヤ1もプレーヤ2も逸脱する誘因を持たない。その意味でそれぞれ安定な状態である。

では、実際にこのゲームをプレーする状況を考えてみよう。よーいドンで手を出し合ったときいずれかのナッシュ均衡が実現するだろうか。実際に実験をしてみると<両者B>や<両者A>もかなりの確率で発生し、必ずしもナッシュ均衡が実現するとは限らない。しかし、その場合も何度かプレーを繰り返しているうちに<1がAで2がB>の状態か<1がBで2がA>のいずれかの状態に落ち着くケースが増えてくる。このとき、プレーヤの手の組み合わせ(戦略プロファイル)がどのように変化していくのかを記述する動学モデルがあれば、ある初期状態から出発したときにどのようなナッシュ均衡に収束しやすいか、あるナッシュ均衡に収束するためにはどのような初期状態が必要であるのかといった問題を考察することができる。また状態変化の収束点になりうる安定なナッシュ均衡や、収束点にはなりえない不安定なナッシュ均衡を識別することも可能になる。

ナッシュ自身、このような動学モデルの必要性を認識していた形跡があるが、プレーヤの出生死滅やプレーヤによる学習を仮定することで集団中の戦略頻度の変化や戦略プロファイルの変化を明示的に分析できるように工夫された動学モデルの体系が進化ゲーム理論である。

レプリケータダイナミクス[編集]

最も一般的な連続時間系のレプリケータダイナミクスは以下のような微分方程式で書かれる。

 \dot{x_i}(t) = x_i(t) \{ f_i(x(t)) - \phi(x(t)) \} , \quad \phi(x(t)) = \sum_{i=1}^{n}{x_i(t) f_i(x(t))}

ここで、xは集団中のiの比率、fはiの適応度を表している。また \phi は集団の平均適応度である。

時間間隔 \tau の離散時間系のレプリケータダイナミクスとして以下のような差分方程式がよく用いられる。

 x_{i}(t+\tau ) = x_i(t) \frac{f_i(x(t))}{\phi(x(t))}


関連項目[編集]

外部リンク[編集]