2人組の犯人AさんとBさんは、それぞれが取り調べを受けています。じつはこのAさんとBさん、逮捕された容疑のほかに、もっとわるい罪の容疑者でもあったのです。このもっとわるい罪の容疑について、AさんとBさんには「黙秘」をするか「自白」をするかの選択肢があります。
各プレーヤーが選択した行動の結果として得られるそれぞれの利益を表にした利得表があります。さて、相手の行動に対して各プレーヤーが選択するもっとも合理的な行動の組み合わせ(「ナッシュ均衡」)は、どれでしょうか。
「ゲーム理論」では、「相手の行動に対する各プレーヤーの(合理的な)行動」について検討します。つまり、相手プレーヤーが「黙秘」を選択した場合の行動と相手プレーヤーが「自白」を選択した場合の行動です。
まずは、Aさんの戦略を考えてみましょう。相手プレーヤーであるBさんが「黙秘」を選択した場合のAさんの利得は、「黙秘」が「-1」、「自白」が「0」です。この場合、Aさんは利得が大きい「自白」を選択します。
Bさんが「自白」を選択した場合のAさんの利得は、「黙秘」が「-7」、「自白」が「-4」です。この場合も、Aさんは利得が大きい「自白」を選択します。

つぎに、Bさんの戦略を考えてみましょう。相手プレーヤーであるAさんが「黙秘」を選択した場合のBさんの利得は、「黙秘」が「-1」、「自白」が「0」です。この場合、Bさんは利得が大きい「自白」を選択します。
Aさんが「自白」を選択した場合のBさんの利得は、「黙秘」が「-7」、「自白」が「-4」です。この場合も、Bさんは利得が大きい「自白」を選択します。
では、AさんとBさんの戦略を整理してみましょう。今回のゲームでは、相手がどちらの戦略であっても、AさんとBさんはともに利得が大きい「自白」を選択しています。この組み合わせ(Aさん「自白」、Bさん「自白」)が、このゲームの「ナッシュ均衡」です。
「ナッシュ均衡」は、「相手の行動に対する」最適な行動の組み合わせです。このゲームでは、AさんとBさんがともに「黙秘」を選択(Aさん「黙秘」、Bさん「黙秘」)すると、2人とも「ナッシュ均衡」の利得よりも大きな利得を得ることができます。しかし、非協力(プレーヤーがおたがいに協力することはありません)ゲームでは、AさんとBさんが協力することはありません。
このように、ほかの組み合わせと比較して、「ナッシュ均衡」におけるおたがいの利得の合計が最大ではない状態を「囚人のジレンマ」といいます(Wikipedia「囚人のジレンマ」)。
2人がそろって「黙秘」を選択すれば、おたがいに「ナッシュ均衡」の利得よりも大きな利得を得ることができます。しかし、AさんとBさんがともに選択した「自白」は、相手の行動に対して各プレーヤーが選択するもっとも合理的な行動の組み合わせなのです。
提携中小企業診断士 岩田 岳
|