無断引用・転載を禁じます


ゲーム理論入門--ゲーム理論の成り立ち

2001年2月19日(月),20(火)放送: 慶應義塾大学中山幹夫 担当.

ゲーム理論の創始者達の理論を学説史的に振り返り,どのような理論として誕生し,何を目指して展開していったのかについて考えます.とくに,数学者フォン・ノイマンの有名なミニマックス定理や経済学者モルゲンシュテルンとの共同研究の成果である結託を許す協力ゲームの理論と,数学者ナッシュによるこれらと補完的な非協力ゲームの理論がどのような発想のもとに創られたのかを考えます.また,ナッシュの交渉問題や,方法論としてのナッシュ・プログラムについても簡単に触れる予定です.

(TOPページへ戻る)

目次


はじめに

 ゲーム理論は,一般に利害の必ずしも一致しない状況における合理的意思決定や合理的配分方法とは何かということについて考えるための数学理論であり,1944年に数学者フォン・ノイマンと経済学者モルゲンシュテルンの共著「ゲームの理論と経済行動」の出版によって世に知られるようになりました.その後,数学者達による理論展開を経て,経済学や経営学,行動科学,政治学などの社会科学全般に,最近ではさらに生物学やコンピュータ・サイエンス,哲学などと互いに影響を及ぼしあう学問分野に成長しています.とくに,経済学では1980年代から産業組織論や情報の経済学を中心に盛んに応用されるようになり,1994年のノーベル経済学賞が3人のゲーム理論研究者に対して与えられたことはまだ記憶に新しいことだと思います.

 ゲーム理論の理論体系には,まず,碁や将棋あるいはチェスなどのように2人のプレイヤーが勝ち負けを争う「ゼロ和2人ゲーム」の理論があります.フォン・ノイマンの有名な「ミニ・マックス定理」は,このゼロ和2人ゲームの最適戦略の存在を主張するものです.プレイヤーが3人以上になりますと,何人かが結託して行動するという可能性を考慮に入れる必要が出てきます.このような,結託行動のもとで,いかなる利得配分が実現するかを考察するのが,「協力n人ゲーム」の理論と呼ばれるものです.協力n人ゲームの理論は,フォン・ノイマンとモルゲンシュテルンの共著「ゲームの理論と経済行動」によって初めて展開された理論で,この大著の半分以上を占めています.また,プレイヤーが2人でも,勝ち負けを争うとは限りませんし,3人以上でも結託を組まずに行動する場合もあります.このようなゲームは「非協力n人ゲーム」と呼ばれています.この非協力n人ゲームは1950年当時,プリンストンの数学の大学院生だったナッシュが博士論文として提出した独創的な理論です.この理論が後になって経済学の発展に与えた影響はきわめて大きく,ナッシュは1994年のノーベル経済学賞受賞者の一人となりました.

 ここでは,このフォン・ノイマンとモルゲンシュテルン,およびナッシュの理論を中心に,やや学説史的に振り返ることによって,ゲーム理論の基礎的な考え方を解説してみようと思います. (目次へ戻る)

ゼロ和2人ゲームとミニ・マックス定理

 2人のプレイヤーが,互いに勝ち負けを争うゲームを「ゼロ和2人ゲーム」と言います.上に述べた,碁や将棋,またチェスなどは,ゼロ和2人ゲームの典型的な例です.ここで,プレイヤーというのは,必ずしも一人の人間である必要はありません.単一の意思決定主体として行動する人間の組織を1個のプレイヤーとみなすこともできます.すると,サッカーや野球のように2チームが争うすべての球技や,2国間の戦争,また,賃金の上昇幅をめぐる労使間交渉などもゼロ和2人ゲームの例となります.「ゼロ和」という用語は,たとえば,勝ちを+1,負けを−1,引き分けを0という数値,つまり「利得」に置き換えて考えるとき,2人のプレイヤーの利得の和がつねにゼロ,または一定値となっていることに由来するものです.この意味でゼロ和ゲームを定和ゲームということもあります.

 さて,このようなゼロ和2人ゲームには,最適なプレイの仕方というものがあるのでしょうか.フォン・ノイマンはこの問題に対して,1928年に「ミニ・マックス定理」という普遍的な解答を提出しています.この定理は,「一方のプレイヤーは最小利得を最大化する戦略,つまりマックス・ミニ戦略をもち,他方のプレイヤーは最大損失を最小化する戦略,つまりミニ・マックス戦略をもっており,しかも,これらの戦略は同じ値をもたらす」ということを述べるものです.この同じ値のことを「ゲームの値」と言います.このように,勝ち負けを争うゼロ和ゲームでは,利得の最大化といういわば当然の行動原理ではなく,最悪の場合でも保証できる利得の最大化という「ミニ・マックス原理」がゲームの解決に導くというのが,フォン・ノイマンの解答であると言えるでしょう.

 この一般的なミニ・マックス定理をジャンケンという特殊なゲームについて例証してみましょう.ジャンケンには,グ−,チョキ,パ−という3通りの手があります.これを,ジャンケンの「純粋戦略」と言います.つまり,プレイヤーは3通りの純粋戦略をもっているわけです.すると,ジャンケンは3行3列のマトリックスで表現することができます.行にはプレイヤー1の純粋戦略グー,チョキ,パーをこの順にとり,列にはプレイヤー2の純粋戦略グー,チョキ,パーをこの順にとります.また,行列の各要素には,対応する純粋戦略の組み合わせによるプレイヤー1の勝ち負けを数値であらわしておきます.ここでは,勝ちは1,負けは−1,引き分けは0としておきましょう.この行列の1行目は0,1,−1,2行目は−1,0,1,3行目は1,−1,0となっていることに注意してください.このように,行列で表現されたゲームを,一般に,「行列ゲーム」と言います.また,その行列を「利得行列」または「利得表」などと言います.

 ところで,私達はジャンケンでは相手の出す手,つまり,相手が選ぶ純粋戦略を推論できないことを経験的に知っています.普通は,無意識にでたらめに,あるいは確率的にジャンケンをプレイしている,と言えるでしょう.ゲーム理論では,このような選択方法を「混合戦略」と呼んでいます.すなわち,ジャンケンでの混合戦略とは,グー,チョキ,パーをそれぞれどんな確率で出すかを指定する確率分布のことです.たとえば,完全にでたらめな選び方は,グー,チョキ,パーを同じ確率,つまり1/3で選ぶという混合戦略で,これは(1/3,1/3,1/3)という確率分布であらわすことができます.また,上に述べた純粋戦略は,特別な混合戦略とみなすことができます.たとえば,グーという純粋戦略は(1,0,0)という混合戦略としてあらわせます.それゆえ,以後ことわらない限り,戦略とは混合戦略を意味するものとしましょう.

 さて,プレイヤー1の立場に立って考えてみましょう.利得表を思い出してください.いま,相手が確率pでグー,確率qでチョキ,確率rでパーという戦略を選ぶとすると,プレイヤー1はグーを出せば,確率pで引き分け,確率qで勝ち,確率rで負けることになります.したがって,グーを選ぶ限り,利得の期待値はp×0+q×1+r×(-1)=q-r と計算できます.同様に,チョキを選ぶならば,p×(-1)+q×0+r×1 = -p+r, また,パーを出すならば,p×1+q×(-1)+r×0 = p-q となることがわかります.そこで,プレイヤー1が,いま,(1/3,1/3,1/3)という戦略をとったならば,最終的な利得の期待値は

(1/3)×(q-r)+(1/3)×(-p+r)+(1/3)×(p-q) = 0

となります.これは,相手の任意の戦略(p,q,r)に対して成立することに注意してください.つまり,プレイヤー1は戦略(1/3,1/3,1/3)をとっていれば,相手の戦略にかかわらず確実に値0を獲得できるわけです.しかし,(1/3,1/3,1/3)以外の戦略だったらこういうわけにはいきません.いま,(p',q',r')を(1/3,1/3,1/3)以外の任意の戦略としましょう.p',q',r'のうち,少なくとも1つは1/3より大ですが,p'が最大であるとします.すると,プレイヤー1はこの戦略では値ゼロはもはや確実に獲得することはできません.何故なら,プレイヤー2はこれに対して(0,0,1)という戦略をとってプレイヤー1の利得を,

p'×(-1)+q'×1+r'×0 = q'-p' < or = 0

のようにゼロ以下にすることができるからです.こうして,プレイヤー1の戦略(1/3,1/3,1/3)は,確実に獲得できる値を最大化する戦略,つまりマックス・ミニ戦略であることがわかります.さらにプレイヤー1と2を入れ替えるとまったく同じようにして,(1/3,1/3,1/3)がプレイヤー2のマックス・ミニ戦略となることもわかります.ゼロ和ゲームでは,自分の利得を最大化することと自分の損失,つまり相手の利得を最小化することは同値ですから,プレイヤー2の目的は損失を最小化することであるとみなすことができます.つまり,利得表の値を最小化することが目的となります.すると,プレイヤー2のマックス・ミニ戦略とは,プレイヤー2の損失に関するミニ・マックス戦略,つまり,最大の損失を最小化する戦略を意味することになります.

 マックス・ミニ戦略は,仮にいくつあったとしても,すべて同じ値の保証利得をもたらすことに注意しましょう.すると,マックス・ミニ戦略とミニ・マックス戦略は,いくつあったとしても,これらが発生する利得はただひとつしかありません.ジャンケンの場合には,完全にでたらめにグー,チョキ,パーを出すことがプレイヤー1のマックス・ミニ戦略であると同時にプレイヤー2のミニ・マックス戦略となり,これらの戦略がもたらす唯一の値=ゼロがジャンケンというゼロ和2人ゲームの値となります.これが,ミニ・マックス定理のジャンケンの場合の内容です. (目次へ戻る)

チェスの必勝戦略

 チェスは典型的なゼロ和2人ゲームですが,ミニマックス定理の16年前の1912年に,集合論で有名なツェルメロがすでに数学的な考察を施しています.ツェルメロが得た結果は,現代のゲーム理論の用語で述べれば

チェスにおいては,一方のプレイヤーが必勝戦略をもつか,あるいは両方のプレイヤーが,悪くとも引き分けとなる戦略をもつ

というものです.実際のチェスのプレイには全く役に立ちませんが,これもミニ・マックス定理が成り立つ特殊ケースのひとつとみなすことができます.チェスはジャンケンと異なり,1回の手番で終了するゲームではありません.しかし,形式的には次のようにしてジャンケンと同じ種類の行列ゲームに変換することができます.チェスでは各プレイヤーは交互に自分の駒を動かしていきますが,自分の手番での可能な局面のパターンはきわめて多く,すべてを記憶することは至難の業です.しかし,如何に多くても有限個しかありませんので,すべてを数え上げることは原理的には可能です.ゲーム理論が想定している理想的なプレイヤーは,原理的に可能なことはすべて実行できるとされていますので,自分の各手番で可能なすべての局面に対して,どの駒を動かすかをあらかじめ決定しておくことが可能となります.このように,自分のすべての手番について,どの手番でどの駒をどのように動かすかを指定する計画のことを,チェスの戦略と定義します.この戦略には,確率的要素は含まれていないことに注意しておきましょう.つまり,チェスの戦略は純粋戦略だけとなります.戦略の数もきわめて膨大なものになりますが,もちろん有限個しかありません.このような戦略がひとつ与えられますと,たとえばチェスについて何も知らない人でも,その計画書に従って駒を動かしていけば,形の上ではチェスをプレイしたことになります.

 こうして,チェスは2人のプレイヤーがそれぞれ有限個の純粋戦略をもつゼロ和ゲームであり,ジャンケンのように2人が同時に戦略を選ぶワン・ショットの行列ゲームとなります.プレイヤー1の純粋戦略の数はm,プレイヤー2の純粋戦略の数はnと仮定しましょう.利得行列の第i行j列の要素は,プレイヤー1がi番目の戦略,プレイヤー2がj番目の戦略を選んだ場合のプレイヤー1の利得,つまりプレイヤー1が勝ちならば1,負けならば−1,また引き分けならば0となっています.これがチェスの利得行列です.

 さて,「必勝戦略」とは,その戦略をとっていれば相手がどんな戦略を選んでも必ず勝つことのできる戦略のことです.すると,仮にプレイヤー1が必勝戦略をもつならば,利得行列にはすべての要素が1であるような行が存在することになり,これがプレイヤー1のマックス・ミニ戦略です.このとき,すべての列はプレイヤー2のミニ・マックス戦略となります.また,プレイヤー2が必勝戦略をもつ場合は,その利得行列にはすべての要素が−1であるような列があって,これがプレイヤー2のミニ・マックス戦略で,すべての行がプレイヤー1のマックス.ミニ戦略となります.さらに,どのプレイヤーも悪くても引き分けにできる戦略をもつ場合は,その利得行列には,すべての要素が0以上の行とすべての要素が0以下の列があってしかも共通の要素が0であるようなものが存在することになります.この場合は,その行がプレイヤー1のマックス・ミニ戦略で,その列がプレイヤー2のミニ・マックス戦略となります.これが,ミニ.マックス定理からみた,ツェルメロのチェスの分析結果です.ここで,ミニ・マックス定理は純粋戦略で成立していることに注意しておきましょう.これは,チェスがもともと完全情報ゲームであることからしたがう結果であり,1950年代にキューン・タッカー定理で有名なキューンによって証明された定理の特殊ケースとなっています.

 「完全情報ゲーム」とは,チェスや将棋または碁などのように,すべてのプレイヤーが自分の各手番において,これまですべてのプレイヤーがどんな選択をしてきたかを知ることができるゲームを言います.このようなゲームでは,終点から逆向きに最適な行動を確定していく,「逆向き推論法」ないし「後ろ向き帰納法」などと呼ばれる方法でゲームを解くことができます.ツェルメロの結果は,この逆向き推論法で証明されたものであり,現代のゲーム理論においても欠くことのできない方法となっています. (目次へ戻る)

協力n人ゲーム

 次に,フォン・ノイマンとモルゲンシュテルンによる「協力n人ゲーム」についてみてみましょう.プレイヤーの数が3以上になると,プレイヤー達は有利な立場をめぐって互いに結託を形成して行動する,というのがフォン・ノイマンとモルゲンシュテルンの基本的考えです.彼らが作り上げた「協力ゲーム」とは,それゆえ,「結託行動」の理論であると言ってもいいでしょう.

 いま,大文字のNでプレイヤーの集合をあらわし,プレイヤーには1からnまでの番号をつけておきます.結託とは,形式的には集合Nの部分集合のことで,これを大文字Sであらわします.すると,論理的に可能な結託の総数は,空集合も含めて2nとなります.協力ゲームでは,これらの2n個の結託は潜在的にどれも等しく実現可能なものとみなし,各結託に対し,もしそれが形成されたならばその結託はどれほどの利得を獲得できるか,ということをまず考えます.フォン・ノイマンとモルゲンシュテルンの理論では,結託Sが形成されると,残りのプレイヤー達は全員で結託N-Sを形成してSに対抗し,SとN-Sは一定値cの取り分をめぐるゼロ和2人ゲームをプレイするというシナリオを想定します.このシナリオが実現可能となるためには,2つの仮定が必要です.まず第一に,各プレイヤーの利得は加え合わせることが可能でなければなりません.これをみたす利得を「譲渡可能効用」と言います.つまり,Sが得た利得はいずれメンバーに分配されることになるわけですから,利得は譲渡可能でなければなりません.第二には,結託Sを形成したプレイヤー達は,あたかも一人のプレイヤーであるかのように行動して結託N-Sに対抗するわけですが,そのためには結託内で戦略を調整しなければなりません.つまり,結託内で合意を形成する必要があります.さらにこの合意は,拘束的でなければ一致して行動するための土台がふらついてしまいます.こうして,結託形成の合意は拘束的であるという仮定も必要となります.

 これらの仮定のもとで,各結託Sはミニ・マックス定理によって,結託N-Sを相手とするゼロ和ゲームの値を獲得することになります.この値を,v(S)と書いて「結託Sの値」と呼びます.ここで,vは「特性関数」と呼ばれるもので,すべての結託Sに対し,Sの値を対応させる関数です.Sが空集合のときは,Sの値はゼロとしておきます.このようにして得られる特性関数vを「定和協力n人ゲーム」と言います.

 この協力n人ゲームの典型的な例としては,次に述べる単純多数決ゲームがあります.3人のプレイヤー1,2および3が多数決によってある決定を行うものとしましょう.多数派は決定権をもつので1,少数派は決定できないので0という利得を獲得するとすれば,容易にわかるように,メンバー数が2以上の結託には1,メンバー数が1以下の結託,つまり個人や空集合には0を対応させる特性関数vが,この状況を記述することになります.このゲームを「単純多数決ゲーム」と言います.このゲームでは任意の結託SとN-Sの値の和はつねに一定値1となっていることに注意しましょう.単純多数決ゲームは,その後,シャプレイとシュービックによって,投票力指数を求める研究に用いられることになりました.

 フォン・ノイマンとモルゲンシュテルンは,「非定和協力n人ゲーム」も定義しています.これは,各結託がマックス・ミニ戦略を用いて獲得できる利得を結託Sの値とするものです.つまり,Sが独力で獲得可能な利得をv(S)と定義して得られるゲームで,これによって,後年,市場ゲームを中心とする経済学的応用が盛んになりました. (目次へ戻る)

安定集合とコア

 さて,協力ゲームでは,プレイヤー達は何を求めて行動するのでしょうか.つまり,協力ゲームの「解」とは一体何だろうかということですが,フォン・ノイマンとモルゲンシュテルンは,以下に述べる「安定集合」という利得の集合を定義してこれを解と名付けたのです.

 プレイヤー全員が協力して得られる利得,つまり,v(N)を各プレイヤーにどのように分配するかをあらわす一覧表を「配分」と言います.ただし,配分によって各プレイヤーiが獲得する値は,独力で獲得できる値,つまりv({i})以上でなければなりません.これを,「個人合理性」の条件と言います.また,各プレイヤーへの分配額の総和は当然v(N)に等しいはずです.これを「全体合理性」の条件と言います.これらの配分のうちで,次に述べる安定性をみたすもの全体を安定集合と定義します.

 いま,任意の2つの配分を考えましょう.これをxとyとします.これらの配分に対し,ある結託Sの各メンバーについて,配分xより配分yの方が大きい額を分配していて,しかも,yによる各メンバーへの分配額の総和が,結託Sの値v(S)以下であるとしましょう.このとき,配分xは配分yに「支配される」と言います.結託Sの各メンバーは全体でv(S)を獲得できるので,配分yによる分配額を自力で実現できます.したがって,それより劣る配分xは,Sにとって全く魅力のないものとなるのです.安定集合はこの支配という概念を用いて次のように定義されます.Kを配分の集合としましょう.このとき,

Kが安定集合であるとは,KはKに属する配分によっては支配されない配分の全体である,

ということです.言い換えますと,Kが安定集合であるとは,第1にKの中の任意の2つの配分には支配の関係はなく,第2に,Kの外の配分は必ずKの中のある配分によって支配される,ということです.この,後者の条件を「外部安定性」,前者の条件を「内部安定性」と言います.こうして,安定集合とは,内部安定性と外部安定性をともにみたす配分の集合となります.ここで,とくに,いかなる配分にも支配されない配分の集合を大文字のCと書きますと,この集合Cは

すべての安定集合の部分集合である

ことがわかります.もしそうでなかったら,Cの中のある配分はある安定集合Kに属さないので,Kのある配分に支配されてしまうという矛盾が生じるからです.この集合Cは,後年,シャプレイによって,コアと名付けられ,経済の市場均衡を解明するきわめて重要な貢献をすることになりました.

 さて,先に述べた単純多数決ゲームの安定集合をみてみましょう.2人のプレイヤーがそれぞれ1/2を獲得し,残った1人はなにも獲得できないという,3種類の配分からなる集合を考えますと,この集合は一つの安定集合であることが証明できます.この安定集合は,「客観解」と呼ばれ,

任意の2人が結託して自分達だけで利得を均等に分け合うこと

が社会的に容認された行動基準である,とフォン・ノイマンとモルゲンシュテルンは解釈しています.さらに,0以上で1/2より小さい任意の値dに対して,

1人のプレイヤーに値dを残し,1-dを2人で任意に分け合うこと

は「差別解」と呼ばれている安定集合です.これは,このように差別的に分配することもまた社会の行動基準の一つであることを意味しています.

 フォン・ノイマンとモルゲンシュテルンは,非定和協力3人ゲ−ムの経済学的応用も提示しています.それは,1人の売り手と2人の買い手の間の家の取引の問題ですが,この取引の安定集合は,

買い手の1人がより高い価格で買う競争的な部分と2人の買い手のうち一方が他方に補償を支払って競争から下りてもらい,残った買い手が低い価格で家を手に入れる部分

とから成っています.最初の部分はコアであり,当時の経済学では,ベ−ム−バベルクのマ−ジナルペアに対応するものです.後の部分も結果的には理解しやすい行動様式ですが,それまでの経済学の常識では導くことができなかった結託行動です.安定集合は,このような行動も,社会的に安定な行動基準として説明することを可能にしたわけです. (目次へ戻る)

非協力n人ゲーム

 次にナッシュの理論をみてみましょう.ナッシュは,フォン・ノイマンとモルゲンシュテルンが考察しなかった問題を考え,単純で美しい理論をうちたてました.非協力n人ゲームと協力2人ゲームの理論です.これによって初めてゲーム理論の土台が完成した,と言えるでしょう.フォン・ノイマンとモルゲンシュテルンが,何故ここまでやらなかったのかについては,知られていませんが,モルゲンシュテルンの弟子だったシュービックは,フォン.ノイマンは安定集合以上に重要なものはn人ゲームにはないと言っていたと書いています.しかし,経済学に関する限り,このフォン.ノイマンの見とおしは,現在までのところ,はずれているようです.80年代以降,経済学者が大挙して応用し発展させて来たのはこのナッシュの理論だからです.

 では,このナッシュの理論とはどのような理論でしょうか.まず,非協力n人ゲームとは,プレイヤー達が結託せずに独立に行動するというn人ゲームです.たとえば,ゼロ和2人ゲームは,この非協力n人ゲームの特殊なケースです.重要なことは,このようなゲームの「解」とは何かということですが,ナッシュは,現在では,「ナッシュ均衡」と呼ばれている均衡概念を定式化しました.これを,2人ゲームから考えてみましょう.

 ジャンケンの場合と同じように,各プレイヤーはそれぞれいくつかの純粋戦略をもっており,これらを確率的に選ぶ混合戦略も使用できるものとします.2人が,同時に戦略を選ぶと,ゲームのルールは,各プレイヤーが獲得する利得をはじき出します.この,2人の利得を加えることができて,しかもつねに一定値となる場合がゼロ和2人ゲームで,これは行列で表現することができました.非協力2人ゲームでは,行列の各要素は,プレイヤー1と2の利得をあらわす2個の数値となります.この意味で,非協力2人ゲームは「双行列ゲーム」と呼ばれることもあります.ただし,ゼロ和ゲームと異なり,2人の利得は加えても一定値とは限りませんし,そもそも,利得が「譲渡可能」であるとも仮定されていませんので,応用範囲がはるかに広くなります.たとえば,一方のプレイヤーの利得が増加すれば,必ず他方のプレイヤーの利得は減少するというような,いわば定性的な対立関係をあらわすゲームも扱えることになります.

 さて,2人ゲームのナッシュ均衡とは,次のような条件をみたす2人の戦略の組のことです.すなわち,

互いに,相手が選んでいる戦略のもとでは,自分の選んだ戦略は自分の利得を最大化している,

という戦略の組です.一般に,相手が選ぶ戦略に対して,自分の利得を最大化する自分の戦略を「最適反応」と言います.すると,ナッシュ均衡とは,互いに最適反応となっているような戦略の組である,と言い換えることができます.互いに最適反応になっているわけですから,自分だけが,ほかの戦略に切り替えるという動機は存在しません.これが均衡しているということの意味です.

 一般のn人ゲームでは,「相手」というところを「自分以外のすべてのプレイヤー」と置き換えるだけでナッシュ均衡の定義が得られます.つまり,n人ゲームのナッシュ均衡とは,

各プレイヤーの選んだ戦略の組で,各プレイヤーについて,自分が選んだ戦略が他のすべてのプレイヤーの選んでいる戦略に対する最適反応となっている

ようなものを言います.

 ナッシュは,このゲームの定式化と均衡の定義,およびその存在証明をほとんど数式を用いずに,わずか1ページの論文として発表しました.証明には,不動点定理と呼ばれる定理が使われましたが,この方法は,それ以後,経済の均衡の存在証明のための標準的方法となりました.

 ここで,ゼロ2人和ゲームのナッシュ均衡は,ミニ・マックス定理を意味することをみておきましょう.ゼロ和2人ゲームでは,相手はこちらの利得を最小化するように行動します.そのため,ナッシュ均衡での利得は,相手の戦略についての最小値となっています.つまり,相手がその戦略からほかの戦略に切り替えても相手の利得は決して増加しませんので,ゼロ和である以上,自分の利得は決して減少しないことになります.言い換えると,均衡での自分の利得は,確実に保証できる利得であることがわかります.しかし,自分だけがほかの戦略に切り替えたとすると,ナッシュ均衡から外れることになりますから,自分の利得は減少することはあっても決して増加しません.つまり,その戦略ではもはや均衡利得以下の値しか保証できません.こうして,ナッシュ均衡は,保証利得を最大化する戦略,すなわちマックス・ミニ戦略の組となっていることがわかります.

 このように,ナッシュの非協力n人ゲームは,フォン・ノイマンの2人ゼロ和ゲームの壮大な拡張となっているのです.また,ゲームの解であるナッシュ均衡も,概念としては単純でよりわかりやすいものです.保証利得が最大化されていることを検証するより,ナッシュ均衡であることを確かめることのほうが一般にはやさしいのです.たとえば,ジャンケンでは,相手が(1/3,1/3,1/3)という混合戦略をとるならば,自分は,どんな混合戦略(p,q,r)をとっても期待利得はゼロとなることが容易に計算できます.つまり,どんな混合戦略も,相手の(1/3,1/3,1/3)に対する最適反応となっているわけですから,とくに(1/3,1/3,1/3)も相手の(1/3,1/3,1/3)に対する最適反応となり,この組はナッシュ均衡となることがわかります.

 非協力n人ゲームは,今日の経済学では必要不可欠な分析用具となっていると言ってもいいでしょう.応用例は無数にありますので,以下ではとくにナッシュ自身による重要な応用例をひとつ取り上げることにします. (目次へ戻る)

協力2人ゲーム

 1950年のエコノメトリカという経済学の国際的専門誌には,"The bargaining problem"というナッシュの論文が掲載されています.この「交渉問題」というタイトルの論文でナッシュが考察したのは,2人のプレイヤ−が交渉を通じて利得の配分を決定するという問題です.これは,それ以前にも何人かの傑出した経済学者達によって試みられたにもかかわらず,当時,満足な解答の欠落した問題でした.ナッシュがこの問題を考察したのは,経済学について何も知らない高校生の時で,ナッシュの解答は「2人の利得の積を最大化する点で交渉は妥結する」というものでした.今日,これはナッシュ交渉解と呼ばれています.この解答は,後で述べますが,公理的方法という数学者の常套手段を用いて導かれました.

 さらに,ナッシュは1953年のエコノメトリカに,交渉を2段階の非協力ゲームとして定式化し,このゲームの均衡点としてナッシュ交渉解を実現するという論文を発表しました.ここで展開されている理論が,ナッシュの「協力2人ゲーム」と呼ばれるものです.交渉という行動は協力行動ですが,これをある非協力ゲームの均衡点として導くということは,単なる知的好奇心を超えた方法論上の意味があります.それは,フォン・ノイマンとモルゲンシュテルンの協力ゲームがそうであったように,一般に協力行動は外部からの拘束力を必要とします.しかし,ナッシュ均衡では,拘束力を仮定しなくても,どのプレイヤーも自分だけが離反するということはありません.つまり,ナッシュ均衡は内生的な拘束力を備えていると言えるわけです.こうして,個々に独立した行動を前提とする非協力ゲームをゲーム理論の基礎におき,協力行動も適当な非協力ゲームの均衡点として導くという方法は,より大きな説明力をもつものと言えるでしょう.これはナッシュ・プログラムとして知られている方法論で,80年代以降の経済学者達によるゲーム理論の応用と展開は,これを実践したものと言えるかも知れません.

 以下では,まず「交渉問題」の定式化から始め,ナッシュ自身によるナッシュ・プログラムの実践ともいうべき,この協力2人ゲームついてみてみましょう.

 いま,双行列であらわされた非協力2人ゲームが与えられたとしましょう.各プレイヤーのとりうる純粋戦略の組のひとつに対して,ゲームのルールから2人が獲得する利得の組がひとつ決まります.つまり,有限個の実現可能な利得の組の一覧表ができるわけです.いま,横軸にプレイヤ−1,縦軸にプレイヤ−2の利得をとって,これらの利得の組をこの座標平面上に書き込みますと,その利得の一覧表は座標平面上の有限個の点の集まりとなります.そこで,これらの点すべてを含む最も小さい凸多角形の領域を考え,これを「利得集合」と言います.

 「交渉問題」では,この利得集合の中のどの点が交渉の妥結点となるかということが問題です.共通に観察できる偶然機構を用いて,いくつかの純粋戦略の組を確率的に実現することによって,プレイヤー達が戦略を調整しあうという行動様式を「相関戦略」と言いますが,利得集合というのは,このような相関戦略によって発生する2人の期待利得の組の全体をあらわしています.利得集合とは,この意味におけるプレイヤー達の協力行動を前提としたときの,実現可能な交渉結果の全体と言えます.交渉が妥結に至らずに決裂した場合には,「基準点」,すなわち利得集合の中のあらかじめ決められた点が実現して交渉が終了します.これがナッシュの交渉のル−ルです.

 さて,結論から言いますと,ナッシュは,利得集合の中で2人の純利得の積,すなわち,基準点から測った利得の積を最大化する点が交渉によって選ばれることになると論じました.いわゆるナッシュ積の最大化で,これが交渉問題の「ナッシュ交渉解」と呼ばれるものです.ナッシュ交渉解は,交渉をつねに唯一の妥結点に導くことがわかります.何故なら,利得集合は凸多角形で,また,ナッシュ積が一定値をとるような曲線は直角双曲線という,原点に向かって反り返った形の曲線だからです.

 ナッシュ交渉解は,公理的方法によって導かれました.公理的方法とはユークリッド以来,数学的対象を特徴付けるための常套手段となっているもので,いくつかの単純な仮定を公理として設定し,対象の存在や特徴付けを行うという方法です.ナッシュは,以下に掲げる4つの公理と純利得の積の最大化とが同値であることを示しました.

公理1.交渉の結果は,2人にとって同時に改善できるものであってはならない.

これは経済学でいうパレ−ト効率性の要請にほかなりません.

公理2.基準点での2人の利得が等しく,また利得集合の中のどんな点についても,その座標を入れ替えても利得集合の外には出ないとする.このとき,交渉の結果は2人に等しい利得を与えなければならない.

これは「対称性の公理」と呼ばれています.利得集合が右上がりの45度線に関して対称で基準点もこの直線上にあるならば,同じ利得で交渉は妥結するべきことを述べています.

公理3.交渉の結果は,効用を測る原点と尺度に依存するものであってはならない.

この公理は,たとえて言いますと,長さをキロメートルで表してもマイルであらわしても,本質的違いがないのと同じであることを述べています.これは,利得に正の数をかけたり正の数を足したり引いたりしても,ゲームのプレイの仕方に影響はない,という性質,このような利得をノイマン=モルゲンシュテルン効用と言いますが,交渉の妥結点も,同じ性質をもたなければならないという当然の要請です.

公理4.交渉の結果は,妥結点以外の代替案が後で削除されたとしても,それに影響を受けてはならない.

これは,Independence of Irrelevant Alternativesの頭文字をとったIIAの名で知られる有名な公理で,「無関係な選択肢からの独立性」と呼ばれているものです.この公理がこれらの中で,最も多くの批判にさらされました.それは,たとえば,ナッシュ交渉解の点を通る水平線より上の部分が欠落した交渉問題を新たに考えますと,この問題のナッシュ交渉解はもとの交渉問題の解と同じになります.しかし,もしこの欠落した部分を,プレイヤ−の失われた交渉力を反映すると考えますと,ナッシュ交渉解はこの意味の交渉力の低下には敏感でないということになります.現代の指導的ゲーム理論家のひとりであるオ−マンは,しかし,次のようなエピソ−ドを,皮肉っぽく伝えています.

...3人の候補者A,B,Cのうち,Aをセミナ−によぶことが決まった.後で,Cはセミナ−には来れないことがわかったので,決定をやりなおそうと提案したところ,『Cが来れなくても結果には影響しないのにどうしてだ?』とけげんな顔をする.つね日頃,経済学のセミナ−ではIIAに批判的な同僚達が,である.(Aumann (1985))

IIAを鋭く批判する理論家達も,現実のIIAには鈍感であったというわけです. (目次へ戻る)

最適脅し戦略

 以上の交渉問題に対して,ナッシュは次のような非協力ゲームを考えました.ゲームは2段階にわたってプレイされます.まず,第1段階では,与えられた双行列ゲームがプレイされます.ここで発生する利得は,交渉が妥結に至らなかった場合に受け取る利得となります.つまり,基準点が決まるわけです.この第1段階のゲームを「脅しゲーム」と言い,ここで選ばれる戦略を「脅し戦略」と言います.第2段階では,各プレイヤーは第1段階で決まった基準点を知って,互いに同時に,利得の要求額を提示します.これを「要求ゲーム」と言います.2人の要求額の組が利得集合の中に入っていれば,それは実現可能ですから要求どおりの利得を各々獲得してゲ−ムは終了します.しかし,もし利得集合の外に出ていれば,2人の要求は両立しませんので,第1段階で決まっていた基準点がゲ−ムの結果となります.

 ここで,先回りをして,この要求ゲームではつねにナッシュ積を最大化する点が実現すると仮定してみましょう.すると,実現する点は基準点から測った利得の積を最大化する点ですから,その利得はもちろん基準点に依存して決まります.さらに基準点は第1段階での脅し戦略によって決まりますから,結局,この要求ゲームでの利得は,脅し戦略だけに依存して決まることになります.その利得は,交渉問題の公理1によってパレ−ト効率的ですから,2人のプレイヤ−について同時に増加することはありえません.すなわち,脅し戦略が変化したとき,もしプレイヤ−1の利得が増加していればプレイヤ−2の利得はかならず減少していることになります.こうして,この交渉の2段階ゲ−ムは,2人の利得がつねに逆方向に変化するゲームとなります.このゲームは,ゼロ和ゲ−ムと同じ性質をもつことが次のようにしてわかります.

 いま,任意の均衡点において,自分がその戦略を保持するとしましょう.すると,相手がどのように戦略を変更したとしても,自分の利得は決して減少しません.つまり,その均衡利得は確実に保証できる利得です.しかも,それは最大の保証利得です.何故ならば,自分がほかの戦略に変更したとき,相手が戦略を変更しなければ自分の利得は決して増加せず,保証利得は低下するだけとなるからです.つまり,任意の均衡点は,2人のマックス・ミニ戦略の組となっているのです.もちろん,自分の利得の最大化は,相手の利得の最小化と同値ですから,この交渉の2段階ゲームの均衡点では,ミニ・マックス定理と同様の定理が成立していることになります.さらに,ミニ・マックス定理のところで述べたように,マックス・ミニ戦略が保証する利得の値は唯ひとつしかありませんから,すべてのマックス・ミニ戦略は同じ保証利得をもたらします.これは,このゲームでは,均衡点がいくつあっても,それらはすべて同じ値をもたらし,しかも,任意の2つの均衡点は「交換可能」であること,つまり,(p,q)と(r,s)がともに均衡点であるならば,qとsを交換して得られる(p,s)と(r,q)もまた均衡点であることを示しています.ナッシュはこの性質を「交換可能性」と呼び,さらに,均衡点が交換可能であって,しかも,すべての均衡点が同じ利得の組をもたらすとき,そのゲームは「解決可能である」と呼びました.こうして,この交渉の2段階ゲームは,解決可能であり,その均衡戦略は事実上唯一の最適な脅し戦略となります.このように,このゲームのナッシュ均衡は,フォン・ノイマンのミニ・マックス定理の美しい拡張を与えることがわかります.これが,ナッシュの協力2人ゲームの内容です.

 さて,ここで,要求ゲームでの戦略の選択の考察に戻りましょう.要求ゲ−ムのナッシュ均衡は,ナッシュ交渉解から得られる唯一の利得の組をもたらすことを示さなければなりません.そのためにまず,第1段階の脅しゲームで選ばれた脅し戦略で決まる基準点に利得集合の座標の原点を移動しておきましょう.2人の利得の要求額の組は,それがちょうど利得集合のパレ−トフロンティア,すなわち,利得集合の第1象限での右下がりの境界上にあるとき,ナッシュ均衡となります.それは,相手のその要求額に対し,自分の要求額を減少させれば利得は減りますし,増加させると,今度はル−ルによって原点,つまり基準点がゲ−ムの結果になりますので,結局その境界上の点が互いに最適反応になることがわかります.すると,ここで無限個の均衡点に直面してしまうことに注意してください.どうやってこの中から唯一つの均衡点を選び出すことができるのでしょうか?

 ナッシュは「平滑化」という方法でこの目的を達成しました.パレ−トフロンティアを横断した瞬間にゼロになってしまう不連続な利得関数を滑らかな関数で近似するのです.座標(x,y)の点で2人の要求額をあらわし,h(x,y)を点(x,y)が両立可能となる確率を与える滑らかな関数とします.利得集合上では値が1で(h(x,y)=1),利得集合から遠ざかるにつれて,決してゼロにはならないように値が単調に減少する関数hを選びますと,2人の利得の期待値は各々xh,yhとなります.ここで,ナッシュ積の期待値 xyh の正の領域全体での最大値が点(x,y)で達成されるとしますと,

固定されたyに対してxhは最大であり,また,固定されたxに対してyhは最大である

ことがわかります.つまり,点(x,y)は定義によってナッシュ均衡となるわけです.さらに,利得集合上でナッシュ積が最大になる点を(x*,y*)としますと,期待値xyhが第1象限の全域で最大であることから,つねに積x*y*は積xyh以下の大きさです.そこで,十分に急速に減少していく関数hを選べば,均衡点(x,y)は点(x*,y*)に十分近くなります.こうして,関数hの列を,減少の度合いが次第に強くなるように選びますと,その関数の列に対応する均衡点の列の極限として,求めるナッシュ交渉解(x*,y*)が得られることになります.
(目次へ戻る)

実験へのコメント

 さて,最後に1950年代初頭に行われた,ナッシュ均衡の実験研究について述べておきましょう.ドレッシャーとフラッドは,サンタモニカにあるランド研究所で,後年,「囚人のジレンマ」として有名になったゲームを考案し,被験者たちが,ナッシュ均衡を実際に選択するか否かを確かめる実験を行いました.結果についての彼らの解釈は否定的なものでした.すなわち,そのゲームの100回の繰り返しにおいて,被験者たちは,無視できない頻度で均衡戦略以外の選択をしたのです.前に述べました,逆向き推論法を使えば,毎回,ナッシュ均衡をプレイするのが,この100回「繰り返しゲーム」の唯一の均衡戦略であることがわかりますが,被験者たちはこのような行動をとりませんでした.この結果についてコメントを求められたナッシュは,次のような興味深い意見を述べています.

 まず,100回という繰り返し回数は逆向き推論法を頭の中で作用させるには長すぎ,それゆえ,無限回繰り返しゲ−ムの理論で近似する方が適切であると述べています.1950年代初頭というと,今日言うところの「繰り返しゲームのフォーク定理」は,まだ専門家の小さいグループでのみ知られていたにすぎません.これは,利得集合の中の,ミニ・マックス戦略で得られる値以上のどんな利得の組も,このゲームを無限回繰り返すことによって,この繰り返しゲームをひとつのゲームとみたときの均衡点として実現可能であることを述べるものです.ナッシュは,明らかにこの事実に言及していますが,このことは,ナッシュ自身がこのフォーク定理,つまり,民間伝承的な定理のルーツである可能性を示しています.

 ナッシュはまた,プレイヤ−を固定せずに様々に組み合わせ,また,繰り返しの途中での情報開示を一切許さずに実験することを提案しています.これは,囚人のジレンマの繰り返しをプレイするアルゴリズムを募り,集まったアルゴリズムをコンピュ−タ上でト−ナメント方式で戦わせることによってアルゴリズムの優劣を観察し協力行動の出現を分析した,1984年のアクセルロッドの画期的な研究を予期するかのようなコメントです.「限定された合理性」しかもたない多数のプレイヤ−=アルゴリズム=遺伝子,が偶然に支配された環境でプレイするゲ−ムの落ち着き先を研究する『進化的ゲ−ム理論』が1980年代以降,重要な研究領域として成長しているのは,このアクセルロッドや生物学者のメイナ−ドスミスなどの仕事が与えた影響によるものです.しかし,このナッシュのコメントによって,その萌芽はゲーム理論の黎明期においてすでに見い出すことができると言えるのではないでしょうか.実際,ナッシュは,その博士論文の中で,ナッシュ均衡を達成するためのシナリオに言及していますが,それは今日,進化的ゲーム理論でいうところの「仮想プレイ」や「学習」によって,プレイヤー達の選択が均衡に収束するという考えを述べたものです.このように,非協力ゲームの創始者たるナッシュは,理論を建設した瞬間に,その半世紀後の発展をすでに見通していたのではないかと言えるかも知れません. (目次へ戻る)