prisonar's dilemma

囚人のジレンマ」について考えた。
何か問題があるんじゃないか、何か状況がもっと良くなるはずじゃないか、そのように感じられるときは、状況が「囚人のジレンマ」に陥っている可能性がある。囚人のジレンマは周知の通り、互いに協調するれば刑期が短くなる囚人が、お互いに裏切られることを恐れるあまり、両方とも裏切ってしまうというものであり、個々にとっての選択が全体にとっての最良の選択にならない場合を示すものである。これは、現実の世界においても、例えば拳銃の保有などで、お互いに拳銃を持たなければ平和なのに、相手が拳銃を持つ恐怖に駆られて自分も拳銃を持ってしまうような状態が考えられる。
ちなみに、繰り返しゲームの場合には、ゲームが何回で終わるかが分かっている場合、それぞれが「裏切り」を選んでしまう。(最終回では裏切りを選ぶことが分かっている)。何回で終わるかが分かっていない場合には、「しっぺ返し」が最も効率的らしい。つまり、最初は「協調」し、その後は相手のとった行動と同じ行動をとるというものである。この場合、次のゲームが続く確率が50%より大きい場合、ナッシュ均衡となることが知られている。
現実の例でこの「繰り返し囚人のジレンマ」を考えてみれば、たとえばある国と国が戦争をして、途中までは相手に合わせて同じ行動をとっていればよく、何かのきっかけでそれが終わると分かった瞬間に裏切ればいいということになる。(のか?)つまり繰り返し囚人のジレンマにおいては、終わるタイミングか、次のゲームで終わる確率が確実に分かる方が勝者となるということが言えるのではないか。
このことから、核兵器保有囚人のジレンマを考えると、ある段階で核兵器保有競争をやめる事が分かった国が、「私は核兵器を持つのをやめます」と言って各国から賞賛の声を浴びるという利益を教授することができるということか。
解体工事に関しても同じことが言えるのではないか。環境配慮に関して、相手を信頼している場合と、相手を信頼せずにしている場合があるとしたら、互いに信頼せずに環境配慮を行っている状態が全体最適ではない。互いに信頼しあいながら環境配慮をすることによって、より少ないコストで環境配慮に寄与し、全体最適とすることができるのではないか。「互いに信頼していない」状態で「良かれと思って、あるいは仕方なく」環境配慮をしている状態を探すのが重要だ。そしてそこにこそ改善の余地がある。
ナッシュ均衡は必ずしもパレート効率的ではない」とは、たとえば囚人のジレンマにおいて、お互いに協調すれば、お互いに犠牲を出さずに各々の利益を出す(パレート効率的ではない)ことができるのにそれをしない状態(ナッシュ均衡)があるということ。
ナッシュ均衡:どのプレーヤーも戦略の変更によって利益の上昇が得られない均衡
パレート効率:誰かの犠牲がなくては他の人の利益が得られない状態。