ナッシュ均衡

ナッシュ均衡（ナッシュきんこう、英: Nash equilibrium）は、ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である。数学者のジョン・フォーブス・ナッシュにちなんで名付けられた。

ナッシュ均衡は、他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせである。ナッシュ均衡の下では、どのプレーヤーも戦略を変更する誘因を持たない。

ナッシュ均衡は必ずしもパレート効率的ではない。その代表例が囚人のジレンマである。

定義[編集]

形式的な定義は次の通りである。標準型ゲーム $G = (N, S, u)$ （ $N$ はプレーヤーの集合、 $S=\prod _{i\in N}S_{i}$ は戦略の組の集合、 $u=(u_{i})_{i\in N}\;(u_{i}:S\rightarrow \mathbb {R} )$ は効用の組）において、戦略の組 $s^{*}\in S$ がナッシュ均衡であるとは、全てのプレーヤー $i\in N$ と、全ての $s_{i}\in S_{i}$ に対して、

u_{i}(s^{*})\geq u_{i}(s_{i},s_{-i}^{*})

を満たすことである。

ただし、 $s - i$ は、 $i$ 以外のプレーヤーの戦略の組をさす。

純粋戦略ゲームにおけるナッシュ均衡[編集]

支配戦略均衡[編集]

「囚人のジレンマ」も参照

純粋戦略ゲーム (Pure strategy game) とは、参加者 (プレーヤー) が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤー P_a と P_b がそれぞれ戦略（A₁ または A₂）と（B₁ または B₂）を選べるときの、それぞれの利得を示す。並んだ数字の左側は P_a の利得、右側は P_b の利得である。

P_a/P_b	B₁	B₂
A₁	5, 2	2, 4
A₂	4, 6	1, 6

まず P_a の利得に注目すると、P_b がどちらの戦略を選ぼうが、P_a は A₁ 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A₁ は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。

次に P_b の利得に注目すると、P_a がどちらに戦略を選んでも、B₂ 戦略を選んだ方が B₁ 戦略のとき以上の利得を得られる。P_a が A₂ 戦略を選んだ場合には B₁ と B₂ は同等になるので、このような関係のとき B₂ は弱支配戦略であるという。

結果として、P_a にとっての最適戦略は A₁、P_b にとっての最適戦略は B₂ となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A₁, B₂) が支配戦略均衡となる。

P_a、P_b が (A₁, B₂) という戦略をとった場合、P_aは戦略を変更して A₂ をとれば利得が 2 から 1 へ減少してしまうため、戦略を変更する誘因を持たない。同様に P_b も、戦略を変更して B₁ をとれば利得が 4 から 2 へ減少してしまうため、戦略を変更する誘因を持たない。従ってこの例では支配戦略均衡はナッシュ均衡である。

なお、P_a、P_b が (A₂, B₁) という戦略をとった場合の利得は (4, 6) となり、ナッシュ均衡における利得と比べて P_a、P_b ともにより大きな利得を得ることができる。この場合、P_a がより大きな 5 の利得を得るため A₁ に戦略を変更する誘因を持つため、ナッシュ均衡ではない。すなわち、このゲームは囚人のジレンマゲームである。また、(A₁, B₂) から (A₂, B₁) への戦略変更は、パレート改善であり、ナッシュ均衡 (A₁, B₂) はパレート効率的ではない。

逐次消去による均衡[編集]

相手の戦略によってどの戦略が最も大きな利得を出すかが変化する場合、他の戦略すべてを支配できる戦略が存在しない場合がある。そのような場合、他から支配されている戦略（被支配戦略）を消去していくことで残った戦略の組み合わせを支配戦略均衡と定義できる。支配戦略によってナッシュ均衡が定義できる場合、それは消去によって定義されたものと一致する。

P_a/P_b	B₁	B₂	B₃
A₁	5, 2	2, 4	4, 0
A₂	4, 6	3, 6	2, 5
A₃	3, 3	1, 2	7, 2

B₃ は B₂ に支配されているため、B₃ を消去。

P_a/P_b	B₁	B₂
A₁	5, 2	2, 4
A₂	4, 6	3, 6
A₃	3, 3	1, 2

A₃ は A₂ に支配されているため A₃ を消去。

P_a/P_b	B₁	B₂
A₁	5, 2	2, 4
A₂	4, 6	3, 6

B₁ は B₂ に支配されているため B₁ を消去。

P_a/P_b	B₂
A₁	2, 4
A₂	3, 6

支配戦略均衡は (A₂, B₂)。

純粋戦略ナッシュ均衡[編集]

他のプレイヤーの戦略によらず最大利得をもたらす戦略の組合せも被支配戦略の逐次消去によって求まる戦略の組合せも支配戦略均衡であるが、ゲームの設定によっては上述した２つの方法では均衡を求めることができない。ナッシュ均衡の定義によれば他のプレイヤーの戦略を最適反応であると仮定したうえで自身の最適反応を求めればよいので、支配戦略均衡が存在しない純粋戦略ゲームにおいてもナッシュ均衡を見つけることができる。

たとえば上の3×3の標準形ゲームの (A₁, B₃) の利得を (4, 0) から (4, 5) に変えればどの戦略も逐次消去されず、支配戦略均衡が求まらないが、

P_a/P_b	B₁	B₂	B₃
A₁	5, 2	2, 4	4, 5
A₂	4, 6	3, 6	2, 5
A₃	3, 3	1, 2	7, 2

相手の戦略を所与としたときに最大利得をもたらす戦略（最適反応）を組み合わせていくと、唯一 (A₂, B₂) が最適反応の組合せになっていることがわかる。従ってこのゲームには純粋戦略ナッシュ均衡が一組存在する。

混合戦略ゲームにおけるナッシュ均衡[編集]

混合戦略ゲームとは、参加者が行動を確率的に選ぶような戦略をとることでナッシュ均衡に到達する非協力ゲームのことである。このようなゲームでは純粋戦略ナッシュ均衡が必ずしも存在せず、ナッシュ均衡は各参加者の行動確率の組として表される。有限の（=プレーヤーの数と各プレーヤーの戦略の数が有限の）混合戦略ゲームでは少なくとも1つのナッシュ均衡が存在することはナッシュの定理で証明されている（ナッシュは、この証明を角谷の不動点定理を応用することによって得た）。

以下では具体例を用いて混合戦略ナッシュ均衡を求めてみる。2人のプレイヤー P_a と P_b はそれぞれ2つの戦略から1つを選択するが、相手がどの戦略を選択するかはわからないため、各プレイヤーが確率的に相手の行動を予測する。すなわち P_a は相手 (P_b) が確率 q で B₁ を選択し、P_b は相手 (P_a) が確率 p で A₁ を選択すると予想しているとする。

P_a/P_b	B₁ 確率 q	B₂ 確率 (1 − q)
A₁ 確率 p	1, 2	0, 0
A₂ 確率 (1 − p)	0, 0	2, 1

この表のゲームにおいて P_a の得る利得の期待値は：

A₁を選択： $1 \times q + 0 \times (1 - q)$
A₂を選択： $0 \times q + 2 \times (1 - q)$

一方、 P_b の得る利得の期待値は：

B₁を選択： $2 \times p + 0 \times (1 - p)$
B₂を選択： $0 \times p + 1 \times (1 - p)$

ここで最適反応をとるとは相手の行動確率に関して期待利得がより大きな戦略を選ぶことであるから、以下のように各プレイヤーの行動をまとめることができる。

P_a/P_b	p > 1/3	p < 1/3
q > 2/3	p=1, q=1	p=1, q=0
q < 2/3	p=0, q=1	p=0, q=0

なお、p=1/3, q=2/3 のときはそれぞれ期待利得が相手の行動に関して無差別なので、平面上に各軸を行動確率（pとq）として各プレイヤーの最適反応をグラフで表わすことができる（これを均衡経路という）。混合戦略ナッシュ均衡とはこの図における均衡経路の交点であり、従って混合戦略ナッシュ均衡において P_a は (1/3, 2/3) を選択し、P_b は (2/3, 1/3) を選択する。

ここで分析したゲームは一般的に両性の争い（英語版）と呼ばれるものである。

参考文献[編集]

論文[編集]

書籍[編集]

ロバート・ギボンズ著、福岡正夫・須田伸一訳『経済学のためのゲーム理論入門』創文社、1995年7月。ASIN 442385080X。ISBN 978-4423850800。 NCID BN12843079。OCLC 673606398。全国書誌番号:95072397。
ジョン・フォン・ノイマン、オスカー・モルゲンシュテルン著、阿部修一・銀林浩・下島英忠・橋本和美・宮本敏雄訳『ゲームの理論と経済行動』筑摩書房〈ちくま学芸文庫〉、2009年5月11日。ASIN 4480092110。ISBN 978-4-480-09211-3。 NCID BA89979297。OCLC 326519825。全国書誌番号:21624029。
Aviad Rubinstein: "Hardness of Approximation Between P and NP", ACM, ISBN 978-1-947487-23-9 (May 2019), doi:10.1145/3241304.　※ナッシュ均衡を求める計算量的な困難さを扱った書籍である。

外部リンク[編集]

日本大百科全書(ニッポニカ)『ナッシュ均衡』 - コトバンク

表話編歴ゲーム理論
定義	非協力ゲーム協力ゲーム標準型ゲーム展開型ゲームベイジアンゲーム簡潔ゲーム（英語版）情報集合信念の階層選好進化ゲームハイパーゲーム（英語版）行動ゲーム
解概念と精緻化	ナッシュ均衡部分ゲーム完全均衡 Mertens-stable equilibrium（英語版）ベイジアン・ナッシュ均衡完全ベイズ均衡摂動完全均衡プロパー均衡 ε均衡相関均衡（英語版、ドイツ語版）逐次均衡準完全均衡進化的安定戦略リスク支配コアシャープレイ値パレート効率性質的応答均衡自己確証均衡強ナッシュ均衡（英語版、ヘブライ語版）マルコフ完全均衡（英語版）戦略的補完性合理化可能性直観的基準
戦略	支配戦略混合戦略（英語版）しっぺ返し戦略トリガー戦略共謀（英語版）後ろ向き帰納法前向き帰納法マルコフ戦略（英語版）主人と奴隷
ゲームのクラス	対称ゲーム（英語版）完全情報完全情報ゲーム完備情報不完備情報ゲーム確実情報同時手番ゲーム逐次手番ゲーム（英語版）繰り返しゲームシグナリングゲームチープトークゼロ和非ゼロ和メカニズムデザイン交渉問題（英語版）確率ゲーム（英語版）大ポアソンゲーム（英語版）非推移的ゲームグローバルゲーム（英語版）特性関数型ゲーム二人零和有限確定完全情報ゲーム
ゲーム	囚人のジレンマ旅人のジレンマ（英語版）協調ゲーム（英語版）チキンゲームムカデゲーム（英語版）ボランティアのジレンマ（英語版）ドル・オークション（英語版）男女の争い（英語版）スタグハントゲームマッチングペニー（英語版）最後通牒ゲームじゃんけん海賊ゲーム（英語版）独裁者ゲーム（英語版）公共財ゲーム（英語版） Blotto games（英語版）消耗戦（英語版）エルファロル・バー問題公平分割行き詰まり（英語版）割り勘のジレンマ Guess 2/3 of the average（英語版）クーン・ポーカー交渉問題（英語版）スクリーニングゲーム（英語版）囚人と帽子のパズル（英語版） Trust game（英語版） Princess and monster game（英語版）モンティ・ホール問題クールノー競争ベルトラン競争シュタッケルベルグ競争
定理	ミニマックス法ナッシュの定理純化定理フォーク定理顕示原理（英語版）アローの不可能性定理
主要人物	ケネス・アローロバート・オーマンケン・ビンモアサミュエル・ボールズメルヴィン・ドレッシャー（英語版）メリル・フラッド（英語版）ドリュー・フューデンバーグ（英語版）ドナルド・ギリースジョン・ハーサニレオニード・ハーヴィッツデイヴィッド・レヴァイン（英語版）ダニエル・カーネマンハロルド・クーンエリック・マスキンジャン＝フランソワ・メルタン（英語版）ポール・ミルグロムオスカー・モルゲンシュテルンロジャー・マイヤーソンジョン・ナッシュジョン・フォン・ノイマンアリエル・ルービンシュタイントーマス・シェリングラインハルト・ゼルテンハーバート・サイモンロイド・シャープレージョン・メイナード＝スミスジャン・ティロールアルバート・タッカーウィリアム・ヴィックリーロバート・ウィルソンペイトン・ヤング（英語版）
関連項目	コモンズの悲劇 Tyranny of small decisions（英語版） All-pay auction（英語版）ゲーム理論におけるゲームの一覧（英語版） Confrontation analysis（英語版）ゲーム理論家の一覧（英語版）数学経済学進化論集団遺伝学オペレーションズリサーチ社会生物学環境社会学クープマンモデル
カテゴリ