好奇心の横断歩道を創る!

自分の思考をラバーダック・デバッグするためのブログ

先進国限定で、ベイジアンネットワークを用いた、経済指標間の因果推論、(ほぼ確実に)失敗した記録

まとめページがこちら

 

 

言い訳とか

事前に想定した通りの結果が出たときだけ記録に残して公表するというのは、私の嫌いな 公表バイアス を助長するし、都合が悪いことを隠蔽しているみたいで気に食わない。ので、正直ろくでもない結果だとは思うけど、もしかしてここから重大な発見をする方も現れるかもしれないと思い、失敗の結果を記録することにした。

 

何したか

今回は、政界各国のいくつかの経済指標が示すデータを用いて、各経済指標同士がどのような因果関係を持つのかを、ベイジアンネットワークを用いて推論していく、といった内容。ベイジアンネットワークをご存じない方は、

①なんとなく読む

②今すぐタブを閉じる

ベイジアンネットワークについて調べる

のいずれかを選択してください。②がおすすめです。

ネットワークのノードに使われた経済指標は、

・実質GDP成長率

・政府支出増加率(GDPデフレーターで調整)

・政府収入増加率(GDPデフレーターで調整)

・民間支出増加率(GDPデフレーターで調節)

・輸出増加率(GDPデフレーターで調節)

・輸入増加率(GDPデフレーターで調節)

2003~2019の毎年の前年比と、2002と2019の比較について、それぞれベイジアンネットワークを用いて因果推論した。もしかしたら、

rokabonatttsu.hatenablog.com

rokabonatttsu.hatenablog.com

で二変数間のグラフを参照しながら読むとよさげかも。知らんけど。

 

情報源と、分析対象となった国の基準

IMFのページから入手したExcelファイルのデータと、The World Bankの財やサービスの輸入対GDP比および財やサービスの輸出対GDP比が情報源。2002~2019までの、

・政府支出(名目値、その国の通貨建て)

・政府収入(名目値、その国の通貨建て)

・名目GDP(その国の通貨建て)

・実質GDP(その国の通貨建て)

消費者物価指数

GDPデフレーター

・財やサービスの輸入対GDP

・財やサービスの輸出対GDP

が、全て欠損なくそろった国を対象とした。対象となった先進国は注釈*1にて。

 

2002と2019を比べた各変数の増加率の分布

6つの経済指標

GDPデフレーター増加率

・実質GDP成長率

・政府支出増加率(GDPデフレーターで調整)

・政府収入増加率(GDPデフレーターで調整)

・民間支出増加率(GDPデフレーターで調節)

・輸出増加率(GDPデフレーターで調節)

・輸入増加率(GDPデフレーターで調節)

の、「2002と2019を比べた各変数の増加率」の相関とヒストグラムがこちら。

f:id:rokaboNatttsu:20210823211542p:plain

6つの経済指標の相関とヒストグラム

対角線上にヒストグラム、他相関図 2002と2019の比較

縦軸も横軸も、いずれも「2019の指標が2002の何倍か」を示す。何%か ではない。何倍かだ。

一行目および一列目=デフレーターの増加率

二行目および二列目=実質GDP増加率

三行目および三列目=輸入額増加率(GDPデフレーターで物価調節)

四行目および四列目=輸出額増加率(GDPデフレーターで物価調節)

五行目および五列目=民間支出増加率(GDPデフレーターで物価調節)

六行目および六列目=政府収入増加率(GDPデフレーターで物価調節)

七行目および七列目=政府支出増加率(GDPデフレーターで物価調節)

である。ベイジアンネットワークを用いた分析の都合上、外れ値や、”外れ値というほどではないが端の方の値”をカットした。カット済みのバージョンがこちら。

f:id:rokaboNatttsu:20210823212001p:plain

6つの経済指標の相関とヒストグラム

対角線上にヒストグラム、他相関図 2002と2019の比較

 

各変数の前年比の分布

続いて7つの経済指標

GDPデフレーター増加率

・実質GDP成長率

・政府支出増加率(GDPデフレーターで調整)

・政府収入増加率(GDPデフレーターで調整)

・民間支出増加率(GDPデフレーターで調節)

・輸出増加率(GDPデフレーターで調節)

・輸入増加率(GDPデフレーターで調節)

の、「2003~2019の毎年の各変数の増加率」の相関とヒストグラムがこちら。

f:id:rokaboNatttsu:20210823202453p:plain

6つの経済指標の相関とヒストグラム

対角線上にヒストグラム、他相関図

前年比

一行目および一列目=実質GDP増加率

二行目および二列目=デフレーターの増加率

三行目および三列目=政府支出増加率(GDPデフレーターで物価調節)

四行目および四列目=政府収入増加率(GDPデフレーターで物価調節)

五行目および五列目=民間支出増加率(GDPデフレーターで物価調整)

六行目および六列目=輸入額増加率(GDPデフレーターで物価調節)

七行目および七列目=輸出額増加率(GDPデフレーターで物価調節)

である。ベイジアンネットワークを用いた分析の都合上、外れ値や、”外れ値というほどではないが端の方の値”をカットした。カット済みのバージョンがこちら。

f:id:rokaboNatttsu:20210823204033p:plain

6つの経済指標の相関とヒストグラム

対角線上にヒストグラム

前年比

ベイジアンネットワークを用いた分析用に端の値をカット

 

ベイジアンネットワークを用いた因果推論の結果

傍線は、独立ではないと推測されたものの、因果関係の向きがわからなかったり向きが無かったりと推測されたもの。矢印は、因果関係の向きとして推測された方向を表す。

前年比

前年比には、「成果」は現れず、「状態」が強く反映されると思われる。

ベイジアンネットワークを用いた因果推論で、二次の独立性の検定まで行った結果がこちら。

f:id:rokaboNatttsu:20210824010044p:plain

2次の独立性まで検定した結果

2変数間の独立性の検定に用いたp値=0.05

bins=5

 

2002と2019の比較

2002と2019の比較のような中期的な比較では、「状態」と「成果」の両方の影響が出ると思われる。

ベイジアンネットワークを用いた因果推論で、ゼロ次の独立性の検定を行った結果がこちら。

f:id:rokaboNatttsu:20210823211204p:plain

0次の独立性まで検定した結果

2変数間の独立性の検定に用いたp値=0.05

bins=2

一次の独立性の限定を行うとこうなる。

f:id:rokaboNatttsu:20210824002513p:plain

1次の独立性まで検定した結果

2変数間の独立性の検定に用いたp値=0.05

bins=2

 

失敗の原因の予想と、今後の記事更新の方針

2002と2019の比較は、サンプル数が少なすぎる。

ベイジアンネットワークを用いた因果推論は、変数間の関係が循環しないことが前提になっているような気がする。一夜漬けの知識を半分くらい動員すると、そうなんじゃないかと思えた。循環しないことが前提ではなかったとしても、何にでも適応できる万能なツールではないことは確かだ。今回のようにマクロ経済指標を用いる場合、単純な因果関係を結べる変数がそもそも存在しない。リアルな経済は多くの人の意思に左右される、とても複雑な現象だからだ。

統計的検定を用いる以上、常に誤差が付きまとう。ベイジアンネットワークを用いた因果推論にはχ二乗検定が多用されている模様。

データ分析において、私は素人。勉強が進み次第この記事も書き換えるかも。今回は失敗の記録。あまり時間を使いたくなかった。記事のクオリティーの低さには、勘弁してもらいたい。

 

分析対象となった先進国一覧

 

*1:

'Australia',
'Austria',
'Belgium',
'Canada',
'Czech Republic',
'Denmark',
'Finland',
'France',
'Germany',
'Greece',
'Sweden',
'Ireland',
'Italy',
'Japan',
'Korea',
'Luxembourg',
'Netherlands',
'New Zealand',
'Norway',
'Portugal',
'Spain',
'Switzerland',
'United States',
'United Kingdom'