質的応答均衡

質的応答均衡（しつてきおうとうきんこう、英: Quantal response equilibrium、 QRE）とは、ゲーム理論における解概念のひとつ。リチャード・マッケルヴィ（英語版）とトーマス・パルフレイ（英語版）によってはじめて導入され、限定合理性のもとでの均衡概念を与えた。質的応答均衡は均衡の精緻化ではなく、ナッシュ均衡とはかなり違った結果を与えている。質的応答均衡は離散的な戦略についてのみ定義されているが、連続な戦略についても類似のものがある。

質的応答均衡において、プレーヤーたちはどの純粋戦略をプレーするか選ぶにあたって誤りを犯すものと仮定されている、特定の戦略が選ばれる確率は、その戦略がもたらす利得の大きさと正の相関をもつ。言いかえると、犠牲の大きい誤りは起こりにくい。

この均衡は信念が実現することから生ずる。プレーヤーの利得は、戦略の上の他のプレーヤーの確率分布に関する信念にもとづいて計算される。均衡においては、プレーヤーの信念は正しい。

データへの応用[編集]

実際のゲームのプレー（とくに、実験室実験）から得られたデータを解析すると、ナッシュ均衡は厳しいのかもしれない。どんな非均衡行動も同じように「間違っている」ように見えるが、現実的には、理論を棄却するために用いられるべきではない。質的応答均衡は、どの戦略も正確率でプレーされることを許容し、したがってどんなデータも不可能とはしない（そうかといってかならずしも合理的ともしない）。

ロジット均衡[編集]

質的応答均衡でもっとも一般的なものは間違いなくロジット均衡 (logit equilibrium: LQRE) である。ロジット均衡では、プレーヤーの戦略は確率分布に従って選ばれる。

P_{ij}={\frac {\exp(\lambda EU_{ij}(P_{-i}))}{\displaystyle \sum _{k}{\exp(\lambda EU_{ik}(P_{-i}))}}}

P_{ij}

は，プレーヤー

i

が戦略

j

を選ぶ確率。

EU_{ij}(P_{-i})

は，プレーヤー

i

が戦略

j

を選ぶとき、他のプレーヤーが確率分布

P_{-i}

に従ってプレーしていることを所与としたときに得られる期待利得。

ロジットモデルにおいてとくに興味があるのは、非負のパラメータ $\lambda$ である（これはときに $1/\mu$ と書かれる）。 $\lambda$ は合理性のパラメータと考えられる． $\lambda \to 0$ となるにつれて、プレーヤーは「完全に非合理的」になり、どの戦略も等確率でプレーするようになる。 $\lambda \to \infty$ となるにつれて、プレーヤーは「完全に合理的」になり、ゲームのプレーはナッシュ均衡に近づく。

動学ゲームに対して[編集]

動学（展開形）ゲームに対して、マッケルヴィとパルフレイはエージェント質的応答均衡 (agent quantal response equilibrium: AQRE) を定義した。AQRE はいくぶん部分ゲーム完全化に似ている。AQRE において、各プレーヤーはQREのようにある誤りを犯す。所与の決定節において、プレーヤーは、将来の自分を、行動のうえに既知の確率分布をもった独立のプレーヤーとみなして、各行動の与える期待利得を決定する。

QREにおいてそうだったように、AQREでは、どの戦略も正の確率で用いられる。このことは、完全合理的な解概念に比べて、AQREに追加的な利点を与える。任意の経路がある確率で実現するのだから、「均衡経路外」における信念を定義するにあたって何の問題も生じないのである。

批判[編集]

自由パラメータ[編集]

LQRE には自由パラメータ $\lambda$ がある． $\lambda \to \infty$ とすると LQRE はナッシュ均衡に近づく。したがってLQREはつねに、少なくともナッシュ均衡と同じくらいはあてはまりがよいことになる。パラメータを変化させると、均衡行動に大きな変化が起こることになる。

しかしながら、この理論は、 $\lambda$ がどこからくるのかを説明しないことには不完全である。実験からの $\lambda$ の推定値は著しく変動しうる。あるときにはこの変動は、個人の特性の効果であるようにみえる（たとえば $\lambda$ はときに学習によって増加する）。別の場合には $\lambda$ は、ゲームに応じて変化するようにもみえる。

参考文献[編集]

McKelvey, Richard; Palfrey, Thomas (1995), “Quantal Response Equilibria for Normal Form Games”, Games and Economic Behavior 10: 6–38, doi:10.1006/game.1995.1023
McKelvey, Richard; Palfrey, Thomas (1998), “Quantal Response Equilibria for Extensive Form Games”, Experimental Economics 1: 9–41, doi:10.1007/BF01426213

表話編歴ゲーム理論
定義	非協力ゲーム協力ゲーム標準型ゲーム展開型ゲームベイジアンゲーム簡潔ゲーム（英語版）情報集合信念の階層選好進化ゲームハイパーゲーム（英語版）行動ゲーム
解概念と精緻化	ナッシュ均衡部分ゲーム完全均衡 Mertens-stable equilibrium（英語版）ベイジアン・ナッシュ均衡完全ベイズ均衡摂動完全均衡プロパー均衡 ε均衡相関均衡（英語版、ドイツ語版）逐次均衡準完全均衡進化的安定戦略リスク支配コアシャープレイ値パレート効率性質的応答均衡自己確証均衡強ナッシュ均衡（英語版、ヘブライ語版）マルコフ完全均衡（英語版）戦略的補完性合理化可能性直観的基準
戦略	支配戦略混合戦略（英語版）しっぺ返し戦略トリガー戦略共謀（英語版）後ろ向き帰納法前向き帰納法マルコフ戦略（英語版）主人と奴隷
ゲームのクラス	対称ゲーム（英語版）完全情報完全情報ゲーム完備情報不完備情報ゲーム確実情報同時手番ゲーム逐次手番ゲーム（英語版）繰り返しゲームシグナリングゲームチープトークゼロ和非ゼロ和メカニズムデザイン交渉問題（英語版）確率ゲーム（英語版）大ポアソンゲーム（英語版）非推移的ゲームグローバルゲーム（英語版）特性関数型ゲーム二人零和有限確定完全情報ゲーム
ゲーム	囚人のジレンマ旅人のジレンマ（英語版）協調ゲーム（英語版）チキンゲームムカデゲーム（英語版）ボランティアのジレンマ（英語版）ドル・オークション（英語版）男女の争い（英語版）スタグハントゲームマッチングペニー（英語版）最後通牒ゲームじゃんけん海賊ゲーム（英語版）独裁者ゲーム（英語版）公共財ゲーム（英語版） Blotto games（英語版）消耗戦（英語版）エルファロル・バー問題公平分割行き詰まり（英語版）割り勘のジレンマ Guess 2/3 of the average（英語版）クーン・ポーカー交渉問題（英語版）スクリーニングゲーム（英語版）囚人と帽子のパズル（英語版） Trust game（英語版） Princess and monster game（英語版）モンティ・ホール問題クールノー競争ベルトラン競争シュタッケルベルグ競争
定理	ミニマックス法ナッシュの定理純化定理フォーク定理顕示原理（英語版）アローの不可能性定理
主要人物	ケネス・アローロバート・オーマンケン・ビンモアサミュエル・ボールズメルヴィン・ドレッシャー（英語版）メリル・フラッド（英語版）ドリュー・フューデンバーグ（英語版）ドナルド・ギリースジョン・ハーサニレオニード・ハーヴィッツデイヴィッド・レヴァイン（英語版）ダニエル・カーネマンハロルド・クーンエリック・マスキンジャン＝フランソワ・メルタン（英語版）ポール・ミルグロムオスカー・モルゲンシュテルンロジャー・マイヤーソンジョン・ナッシュジョン・フォン・ノイマンアリエル・ルービンシュタイントーマス・シェリングラインハルト・ゼルテンハーバート・サイモンロイド・シャープレージョン・メイナード＝スミスジャン・ティロールアルバート・タッカーウィリアム・ヴィックリーロバート・ウィルソンペイトン・ヤング（英語版）
関連項目	コモンズの悲劇 Tyranny of small decisions（英語版） All-pay auction（英語版）ゲーム理論におけるゲームの一覧（英語版） Confrontation analysis（英語版）ゲーム理論家の一覧（英語版）数学経済学進化論集団遺伝学オペレーションズリサーチ社会生物学環境社会学クープマンモデル
カテゴリ