経済学・経済政策
重要ゲーム理論
支配戦略、ナッシュ均衡、囚人のジレンマ、逐次ゲームを扱う。
この章で覚えておきたいこと
ゲーム理論は、相手の行動によって自分の利得が変わる場面を分析する考え方です。一次試験では、難しい数式よりも、利得表や樹形図を読んで「誰が、何を選び、どの組合せが安定するか」を判断できることが重要です。
- ゲームは、プレーヤー、戦略、利得で整理します。
- 利得表では、相手の行動を固定して、自分の利得だけを比較します。
- 支配戦略は、相手が何を選んでも自分にとって有利な戦略です。
- ナッシュ均衡は、どちらも一方的に戦略を変えて利得を改善できない組合せです。
- 囚人のジレンマでは、個々の合理的選択が全体として望ましい協力解から外れます。
- 協力解、パレート最適、ナッシュ均衡は同じとは限りません。
- 繰り返しゲームでは、将来の罰や評判が協力を支えることがあります。
- 逐次ゲームでは、後ろから考えるバックワード・インダクションが基本です。
試験では、「合計利得が大きいマス」をすぐ均衡としないことが大切です。均衡かどうかは、各主体が自分だけ戦略を変えたときに得をするかで確認します。
基本知識
ゲームの構成要素
ゲーム理論では、まず状況を次の4つに分解します。
| 要素 | 確認すること |
|---|---|
| プレーヤー | 意思決定をする主体は誰か |
| 戦略 | 各主体が選べる行動は何か |
| 利得 | 行動の組合せごとの結果は何か |
| 情報と順番 | 同時に選ぶのか、相手の行動を見てから選ぶのか |
一次試験では、2人または2社、2国の利得表が多く出ます。カッコ内の左側が行側の主体、右側が列側の主体の利得であることが多いですが、問題文で必ず確認します。
利得表を読むときは、表全体で最大の数字を探すのではありません。相手の戦略を1つ固定し、その条件の下で自分の利得を比較します。この作業を行側と列側の両方で行うと、最適反応、支配戦略、ナッシュ均衡が見えてきます。
支配戦略
支配戦略とは、相手がどの戦略を選んでも、自分にとって他の戦略より高い利得を与える戦略です。
たとえば、相手が協力しても非協力でも、自分は非協力を選んだ方が利得が高いなら、非協力が支配戦略です。支配戦略を探す手順は単純です。
- 相手の1つ目の戦略を固定します。
- その列または行の中で、自分の利得が大きい戦略を選びます。
- 相手の2つ目の戦略でも同じ比較をします。
- どちらの場合も同じ戦略が有利なら、それが支配戦略です。
両者に支配戦略がある場合、その組合せはナッシュ均衡になりやすいです。ただし、支配戦略がないゲームでもナッシュ均衡は存在します。支配戦略の有無と、ナッシュ均衡の有無を混同しないようにします。
ナッシュ均衡
ナッシュ均衡とは、各主体が相手の戦略を所与としたとき、自分だけ戦略を変えても利得を改善できない組合せです。
利得表では、各マスについて次の2点を確認します。
- 行側の主体が、同じ列の中で別の行へ移ると利得が上がるか。
- 列側の主体が、同じ行の中で別の列へ移ると利得が上がるか。
どちらも一方的に移って得をしないマスがナッシュ均衡です。ナッシュ均衡は「社会全体にとって最も良い組合せ」とは限りません。むしろ、囚人のジレンマでは、ナッシュ均衡が全体として望ましい協力解より悪くなります。
囚人のジレンマ
囚人のジレンマは、各主体が自分の利得だけを考えると非協力を選び、結果として両者にとって望ましい協力解から外れるゲームです。
典型的な構造は、次のように整理できます。
| 見る場所 | 判断 |
|---|---|
| 個別の誘因 | 相手が協力しても非協力でも、自分は非協力を選びやすい |
| 均衡 | 双方が非協力を選ぶ組合せになりやすい |
| 全体の望ましさ | 双方が協力する方が合計利得や両者の利得は高いことがある |
過去問では、企業のカルテル、国際貿易、環境政策、家事分担、特許権の共有、価格競争などが囚人のジレンマ型で出ています。共通する判断軸は、「協力すれば全体として良いが、片方だけ裏切ると個別にはさらに得をする」という誘因です。
協力解、パレート最適、ナッシュ均衡
ゲーム理論の問題では、似た言葉を分ける必要があります。
協力解は、プレーヤー同士が合意や拘束力のある約束をできる場合に選びやすい結果です。自由貿易協定やカルテルの合意のように、互いに協調できれば全体の利得を高められることがあります。
パレート最適は、誰かの利得を下げずに、別の誰かの利得を上げることができない状態です。合計利得が最大かどうかとは別概念です。
ナッシュ均衡は、相手の戦略を所与として、自分だけが変えても得をしない状態です。そのため、パレート最適でないナッシュ均衡もあります。
試験では、「両者にとって望ましい」「合計利得が大きい」という表現だけでナッシュ均衡と判断しないようにします。最後は必ず、一方的な戦略変更の誘因を確認します。
繰り返しゲームとフォーク定理
一回限りの囚人のジレンマでは、非協力が均衡になりやすいです。しかし、同じ相手と取引を何度も繰り返す場合は、協力が維持されることがあります。
理由は、今日裏切って得をしても、明日以降に取引停止、報復、評判低下といった損を受けるからです。将来の利得を十分に重視するなら、短期の裏切りよりも長期の協力を選ぶ誘因が生まれます。
フォーク定理は、無限回繰り返しゲームでは、将来利得を十分重視する場合に、協力的な結果を含むさまざまな利得配分が均衡として成立しうることを示します。
マイクロクレジットの定期返済や連帯責任も、繰り返しゲームの考え方で理解できます。返済を怠ると、将来の借入機会や仲間との関係に悪影響が出るため、契約後のモラルハザードを抑えやすくなります。
協調ゲームと複数均衡
すべてのゲームが囚人のジレンマ型ではありません。夫婦や企業が「相手に合わせるほど得をする」ような協調ゲームでは、相手の選択に応じて自分の最適反応が変わります。
たとえば、夫が水泳、妻がジョギングを好むが、別々に行動するより一緒に行動したい場合、双方が水泳を選ぶ組合せと、双方がジョギングを選ぶ組合せの両方がナッシュ均衡になりえます。このようなゲームでは、支配戦略がないこともあります。
試験では、「支配戦略があるか」「ナッシュ均衡が1つか複数か」を分けて問われます。相手に合わせるゲームでは、相手の行動ごとに最適反応が変わるため、囚人のジレンマと同じ処理を機械的に当てはめないようにします。
逐次ゲームとバックワード・インダクション
逐次ゲームでは、プレーヤーが同時に動くのではなく、先手と後手があります。樹形図で表される問題では、後手の選択を先に考え、その反応を見越して先手の選択を決めます。
この考え方がバックワード・インダクションです。
- 最後に行動するプレーヤーの選択肢を比較します。
- 後手がどちらを選ぶかを確定します。
- その結果を前提に、先手の利得を比較します。
- 先手が最初に選ぶ戦略を決めます。
参入ゲームでは、既存企業が高価格か低価格を選び、新規企業が参入するかどうかを選ぶ形で出題されました。先手の既存企業は、後手の新規企業が参入するかどうかを見越して行動します。
反応関数、戦略的代替、戦略的補完
寡占企業の競争では、相手の行動に対して自社がどう反応するかを反応関数で表すことがあります。
数量競争では、相手が生産量を増やすと自社は生産量を減らしたくなることが多く、これを戦略的代替といいます。反応関数は右下がりになりやすいです。
価格競争で差別化された財を扱う場合、相手が価格を上げると自社も価格を上げやすくなることがあります。これを戦略的補完といい、反応関数は右上がりになりやすいです。
逐次手番では、数量競争では先導者が有利になりやすく、価格競争では追随者が有利になりやすい、という形で問われることがあります。図の交点だけでなく、先手・後手のどちらが反応を利用できるかを確認します。
立地競争と最低価格保証
立地競争では、利得表がなくても「相手の位置を所与として、自分が少し動くと客を増やせるか」を考えます。客が一直線上に均等に分布し、近い店を選ぶなら、2店は中央に近づきやすくなります。均衡は、片方だけ動いても取り分が増えない位置です。
最低価格保証は、他社が自社より安く売ったときに同じ価格まで下げる約束です。同質財市場では、相手より安くして顧客を奪う利得が小さくなるため、価格引き下げ競争を弱める方向に働きます。
この2つは、利得表の数字を直接比較する問題ではありませんが、考え方は同じです。相手の行動を所与として、自分が一方的に動く誘因が残っているかを見ます。
この章のまとめ
ゲーム理論は、用語暗記よりも読み方の順序が得点に直結します。利得表を見たら、まずプレーヤー、戦略、利得の順番を確認し、相手の行動を固定して自分の利得を比較します。
利得表を読む手順
- カッコ内の左側と右側が誰の利得かを確認します。
- 相手の戦略を1つ固定し、自分の利得を比較します。
- もう一方の相手の戦略でも同じ比較をします。
- 常に同じ戦略が有利なら支配戦略です。
- 行側と列側の最適反応が重なるマスを探します。
- そのマスで、どちらも一方的に変えて得をしなければナッシュ均衡です。
ひっかけを避ける判断軸
- 合計利得最大だけでナッシュ均衡と判断しません。
- 協力解と均衡は一致しないことがあります。
- 支配戦略がないゲームでも、ナッシュ均衡は存在しえます。
- 囚人のジレンマでは、個別合理性と全体最適がずれます。
- 繰り返しゲームでは、将来の罰や評判が協力を支えます。
- 逐次ゲームでは、先手からではなく後手の最適反応から考えます。
- 反応関数では、数量競争と価格競争で先導者・追随者の有利不利が変わることがあります。
最後に確認することは、「相手を固定して比較したか」です。表全体の最大値を探す、合計利得だけを見る、問題文の印象で協力を選ぶ、という解き方は誤答につながります。
一次試験過去問での出方
2007年 第15問: 囚人のジレンマ、支配戦略、ナッシュ均衡、フォーク定理が問われました。
2008年 第17問: 海辺の店の立地競争で、相手の位置を所与にした最適立地とナッシュ均衡が問われました。
2010年 第11問: 自由貿易と保護貿易の利得表から、協力解と非協力ゲームの均衡の違いが問われました。
2010年 第14問: マイクロクレジットを、繰り返しゲームとモラルハザード対策として読む問題が出ました。
2010年 第18問: 数量競争と価格競争の反応関数、先導者と追随者の利得比較が問われました。
2011年 第23問: 最低価格保証が価格競争を弱める仕組みが問われました。
2012年 第23問、2013年 第21問、2018年 第21問、2020年 第22問、2022年 第20問、2023年第1回 第22問: 利得表から支配戦略、最適反応、ナッシュ均衡、囚人のジレンマを読む問題が繰り返し出ています。
2014年 第22問: 無限回繰り返しゲーム、トリガー戦略、フォーク定理の理解が問われました。
2015年 第20問: 参入ゲームで、ナッシュ均衡とバックワード・インダクションの違いが問われました。
2017年 第17問: 協調ゲームで、支配戦略がない場合や複数のナッシュ均衡を読む問題が出ました。