「閉じた社会のルールは最も多くを搾取できる人間が決める」の説明、権力や暴力の有益な使い道について、など

「海賊の経済学」だったかな、そんな感じのタイトルの本があって、かつての海賊は身内に対して民主的な政治を行っていた、みたいなことが書いてあったと思う。構成員がトップの政治に不満を持つと、次の航海からその船に乗らなくなったし、悪い場合は無人島に拳銃一つ持たされて置き去りにされたりする。下の者の機嫌を損なうのは危険だ。だから偉い立場には特権と同時に義務や責任のようなものが重くのしかかった。

海賊に限らず、民衆の暴力が民主的な政治体制を勝ち取った例は多い。一方で、安定した独裁体制は、暴力の独占によってのみ成立しうる。暴力それ自体は、より平等な仕組みを作ることもあれば、より不平等な仕組みを作ることもある。体制の在り方を左右するのは、社会構成員の相対的な力関係と、強い者の良心の有無だ。力関係は実に様々な要素から成り立ち、全体像から詳細までを把握することは困難だ。そこで、かなり単純化したものの見方を試してみる。

ゲーム理論の初歩的な説明の文脈では、タカハトゲームが、しばしば登場する。

タカ戦略とハト戦略がどのようなニュアンスを持っているのかはここでは触れない。ここでは簡単のためにエージェント数を2とする。エージェントA,Bがそれぞれタカ戦略とハト戦略をとりうるときの利得行列が

こんな感じのゲームを、タカハトゲームと呼ぶらしい。

Aがタカ戦略をとる確率をp、Bがタカ戦略をとる確率をqと書くことにする。この利得行列が示すナッシュ均衡は、私の計算が間違っていなければ、

(p, q)=(0, 1), (1/3, 1/3), (1, 0)

の3つ。どちらか一方がタカ、もう一方がハトとなり、行動を固定する場合。あるいは、どちらも1/3の確率でタカになる場合。この2種類がナッシュ均衡にあたる。

AとBの利得の合計は、(p, q)=(0, 1), (1, 0)　では４、(p, q)=(1/3, 1/3)では3.333...となる。AとBの全体の利益が最大化するのは、ハトとタカの役割分担、すなわち(p, q)=(0, 1), (1, 0)のときだ。役割分担は同時に不平等を生み出す。もしもAとBがともに良心的で賢ければ、役割分担を当番制にすることで、利益の最大化と不平等の解消を両取りするかもしれない。

上の利得行列は、AとBを同質な存在として扱っている。ただ、タカハトゲームに似た現実的な場面には、AとBの間にさまざまな種類の能力差や性格差が存在する可能性もある。利得行列は以下のように歪むことも考えられる（もはやタカハトゲームとは呼べないが）

タカ戦略で衝突したとき、Bが暴力でAを圧倒する場合だ。このとき、ナッシュ均衡は

(p, q)=(0, 1)

のみ。暴力に秀でたBが常にタカ戦略をとり、弱いAは常にハト戦略をとることになる。Aがタカだろうがハトだろうが、Bはタカを選ぶほうが有益。Bがタカを選ぶならAはハトを選ぶべきだ。

アメリカでは「優しさは弱さだ」という空気があるとかないとか、そんな噂を聞いたことがあるような気がしなくもない(超曖昧でゴメン)が、そのような心情に至るとしてもわからなくはない。

出入りが難しい「閉じた社会」においては、様々な意味での武力が、自身の利益（少なくとも優位性）を、手に入れるために必要になる。

仮に、暴力に秀でたBが平等の精神を重んじる人格者だった場合、Bはゲームの結果をナッシュ均衡と別の位置に操作することができる。BがAの行動を指示して、タカとハトを当番制にすることもできるし、タカ禁止命令を下しつつB自身もハト戦略をとることもできる。当番制だろうがタカ禁止だろうが、Bが機嫌を損なわず良心的でいることは、Aにとって得なので、AはBが定めたルールに従うだろう。Bからハトでいるように指示・命令されているにもかかわらず、Aがタカ行動をとれば、Bはタカを取り続けるという制裁を加えるだろう。AはBに従うのが賢明だ。Aの行動はBの一存でコントロールできる。

「閉じた社会のルールは最も多くを搾取できる人間が決める」のだ。

ちなみに、AとBの暴力の能力には差がないが、生産性に差がある場合は存在する。利得行列が例えばこのようになると、

ナッシュ均衡は

(p, q)=(0, 1), (1/4, 1/3), (1, 0)

となり、AとBの利得の合計は、(p, q)=(0, 1), (1, 0)において5、(p, q)=(1/4, 1/3)において4.41666...となる。役割分担は全体の利益と不平等を生み出す。もしもAとBがともに良心的で賢ければ、役割分担を当番制にするかもしれないし、役割を固定しつつ税をとって再分配するかもしれない。

ゲームのルールは何もタカハトだけでは無い。例えば、自動車を左側通行に統一するなど、同調することで利益を得る場合も多い。エージェントA,Bに対してそれぞれ行動の選択肢X,Yがあるとき、利得行列が

のようになったとしよう。AがXをとる確率をp、BがXをとる確率をqとすると、ナッシュ均衡は

(p, q)=(0, 0), (1/3, 1/3), (1, 1)

で、AとBの利得が最も大きくなるのは(p, q)=(0, 0)のとき。仮に(p, q)=(1, 1)が実現した場合、なんとか(p, q)=(0, 0)に誘導する手段はないか。話し合いを持つことで特定のタイミングから(p, q)=(0, 0)に移動することもできるし、どちらかが短期的な利益を放り出して強硬にYを取り続けていれば、もう一方もきっとYをとるようになる。

エージェント数が2よりもはるかに大きくなると、話し合い、合意し、一斉に行動を変えることでしか、均衡を乗り換えることはできないだろう。誰もが得をするとわかっていても、権力が音頭を取らなければ、異なる均衡に乗り換えることができない、かもしれない。

純粋な役割分担が利益をもたらすゲームもある。

ナッシュ均衡は、

(p,q)=(0,1), (1/3, 2/3), (1,0)

もっとも利得が大きいのは(p,q)=(1,0) 。放置していれば(p,q)=(1,0)に至るという保証はないが、中央当局が十分な権力を持ち、利得行列を知っていれば、均衡点を選ぶことも出来ることだろう。

ゲームのルールには囚人のジレンマと同じ構造のものもある

ナッシュ均衡はAとBがともにYを選ぶ場合だが、4つの中で利得の合計が最も低い。そこで、AとBを支配する権力が現れ、裏切り者に重い制裁-10を加えることにすると、

ナッシュ均衡はAとBがともにXを選ぶ場合にシフトする。ゲームのルールが変われば、均衡も変化しうる。制裁のルールを加えることで、AとBが得をするのだ。暴力を行使できる権力が、脅しをかけることによって、大いに社会貢献を果たす可能性を示している。

この記事の文脈におけるナッシュ均衡が実現するには、エージェントが利得行列という情報を知っているか、もしくは、ゲームのルールが不変の条件下で試行錯誤とフィードバックを繰り返して行動を修正する必要がある。この前提が現実的ではない場合は多い。利得行列を知ることはしばしば難題だし、ゲームのルールが不変とも限らない。あくまで、かなり単純化した物の見方だ。

好奇心の横断歩道を創る！

自分の思考をラバーダック・デバッグするためのブログ

「閉じた社会のルールは最も多くを搾取できる人間が決める」の説明、権力や暴力の有益な使い道について、など