- 言い訳とか
- 何したか
- 情報源と、分析対象となった国の基準
- 2002と2019を比べた各変数の増加率の分布
- 各変数の前年比の分布
- ベイジアンネットワークを用いた因果推論の結果
- 失敗の原因の予想と、今後の記事更新の方針
- 分析対象となった発展途上国一覧
言い訳とか
事前に想定した通りの結果が出たときだけ記録に残して公表するというのは、私の嫌いな 公表バイアス を助長するし、都合が悪いことを隠蔽しているみたいで気に食わない。ので、正直ろくでもない結果だとは思うけど、もしかしてここから重大な発見をする方も現れるかもしれないと思い、失敗の結果を記録することにした。
何したか
今回は、政界各国のいくつかの経済指標が示すデータを用いて、各経済指標同士がどのような因果関係を持つのかを、ベイジアンネットワークを用いて推論していく、といった内容。ベイジアンネットワークをご存じない方は、
①なんとなく読む
②今すぐタブを閉じる
③ベイジアンネットワークについて調べる
のいずれかを選択してください。②がおすすめです。
ネットワークのノードに使われた経済指標は、
・実質GDP成長率
・政府支出増加率(GDPデフレーターで調整)
・政府収入増加率(GDPデフレーターで調整)
・民間支出増加率(GDPデフレーターで調節)
・輸出増加率(GDPデフレーターで調節)
・輸入増加率(GDPデフレーターで調節)
2003~2019の毎年の前年比と、2002と2019の比較について、それぞれベイジアンネットワークを用いて因果推論した。もしかしたら、
や
で二変数間のグラフを参照しながら読むとよさげかも。知らんけど。
情報源と、分析対象となった国の基準
IMFのページから入手したExcelファイルのデータと、The World Bankの財やサービスの輸入対GDP比および財やサービスの輸出対GDP比が情報源。2002~2019までの、
・政府支出(名目値、その国の通貨建て)
・政府収入(名目値、その国の通貨建て)
・名目GDP(その国の通貨建て)
・実質GDP(その国の通貨建て)
・財やサービスの輸入対GDP比
・財やサービスの輸出対GDP比
が、全て欠損なくそろった発展途上国を対象とした。対象となった発展途上国は注釈*1にて。
2002と2019を比べた各変数の増加率の分布
6つの経済指標
・GDPデフレーター増加率
・実質GDP成長率
・政府支出増加率(GDPデフレーターで調整)
・政府収入増加率(GDPデフレーターで調整)
・民間支出増加率(GDPデフレーターで調節)
・輸出増加率(GDPデフレーターで調節)
・輸入増加率(GDPデフレーターで調節)
の、「2002と2019を比べた各変数の増加率」の相関とヒストグラムがこちら。
縦軸も横軸も、いずれも「2019の指標が2002の何倍か」を示す。何%か ではない。何倍かだ。
一行目および一列目=デフレーターの増加率
二行目および二列目=実質GDP増加率
三行目および三列目=輸入額増加率(GDPデフレーターで物価調節)
四行目および四列目=輸出額増加率(GDPデフレーターで物価調節)
五行目および五列目=民間支出増加率(GDPデフレーターで物価調節)
六行目および六列目=政府収入増加率(GDPデフレーターで物価調節)
七行目および七列目=政府支出増加率(GDPデフレーターで物価調節)
である。ベイジアンネットワークを用いた分析の都合上、外れ値や、”外れ値というほどではないが端の方の値”をカットした。カット済みのバージョンがこちら。
各変数の前年比の分布
続いて7つの経済指標
・GDPデフレーター増加率
・実質GDP成長率
・政府支出増加率(GDPデフレーターで調整)
・政府収入増加率(GDPデフレーターで調整)
・民間支出増加率(GDPデフレーターで調節)
・輸出増加率(GDPデフレーターで調節)
・輸入増加率(GDPデフレーターで調節)
の、「2003~2019の毎年の各変数の増加率」の相関とヒストグラムがこちら。
一行目および一列目=実質GDP増加率
二行目および二列目=デフレーターの増加率
三行目および三列目=政府支出増加率(GDPデフレーターで物価調節)
四行目および四列目=政府収入増加率(GDPデフレーターで物価調節)
五行目および五列目=民間支出増加率(GDPデフレーターで物価調整)
六行目および六列目=輸入額増加率(GDPデフレーターで物価調節)
七行目および七列目=輸出額増加率(GDPデフレーターで物価調節)
である。ベイジアンネットワークを用いた分析の都合上、外れ値や、”外れ値というほどではないが端の方の値”をカットした。カット済みのバージョンがこちら。
ベイジアンネットワークを用いた因果推論の結果
傍線は、独立ではないと推測されたものの、因果関係の向きがわからなかったり向きが無かったりと推測されたもの。矢印は、因果関係の向きとして推測された方向を表す。
前年比
前年比には、「成果」は現れず、「状態」が強く反映されると思われる。
ベイジアンネットワークを用いた因果推論で、ゼロ次および一次の独立性の検定を行った結果がこちら。
続いて、2次の独立性の検定を行うとこうなった
2002と2019の比較
2002と2019の比較のような中期的な比較では、「状態」と「成果」の両方の影響が出ると思われる。
ベイジアンネットワークを用いた因果推論で、ゼロ次および一次の独立性の検定を行った結果がこちら。
失敗の原因の予想と、今後の記事更新の方針
ベイジアンネットワークを用いた因果推論は、変数間の関係が循環しないことが前提になっているような気がする。一夜漬けの知識を半分くらい動員すると、そうなんじゃないかと思えた。循環しないことが前提ではなかったとしても、何にでも適応できる万能なツールではないことは確かだ。今回のようにマクロ経済指標を用いる場合、単純な因果関係を結べる変数がそもそも存在しない。リアルな経済は多くの人の意思に左右される、とても複雑な現象だからだ。
統計的検定を用いる以上、常に誤差が付きまとう。ベイジアンネットワークを用いた因果推論にはχ二乗検定が多用されている模様。
データ分析において、私は素人。勉強が進み次第この記事も書き換えるかも。今回は失敗の記録。あまり時間を使いたくなかった。記事のクオリティーの低さには、勘弁してもらいたい。
分析対象となった発展途上国一覧
*1:
'Albania',
'Algeria',
'Angola',
'Antigua and Barbuda',
'Azerbaijan',
'Bahrain',
'Bangladesh',
'Barbados',
'Belarus',
'Belize',
'Benin',
'Bhutan',
'Bolivia',
'Bosnia and Herzegovina',
'Botswana',
'Brazil',
'Brunei Darussalam',
'Bulgaria',
'Burundi',
'Cabo Verde',
'Cambodia',
'Cameroon',
'Chile',
'China',
'Colombia',
'Costa Rica',
'Croatia',
'Cyprus',
'Democratic Republic of the Congo',
'Ecuador',
'Egypt',
'El Salvador',
'Estonia',
'Eswatini',
'Fiji',
'Gabon',
'Georgia',
'Grenada',
'Guatemala',
'Haiti',
'Honduras',
'Hong Kong SAR',
'Hungary',
'India',
'Indonesia',
'Islamic Republic of Iran',
'Israel',
'Jamaica',
'Jordan',
'Kazakhstan',
'Kenya',
'Kosovo',
'Kuwait',
'Kyrgyz Republic',
'Latvia',
'Lithuania',
'Macao SAR',
'Malaysia',
'Malta',
'Mexico',
'Moldova',
'Mongolia',
'Montenegro',
'Morocco',
'Mozambique',
'Myanmar',
'Namibia',
'Nepal',
'Nicaragua',
'Niger',
'Nigeria',
'North Macedonia',
'Pakistan',
'Panama',
'Paraguay',
'Peru',
'Philippines',
'Poland',
'Romania',
'Samoa',
'Saudi Arabia',
'Senegal',
'Serbia',
'Seychelles',
'Singapore',
'Slovak Republic',
'Slovenia',
'Solomon Islands',
'South Africa',
'Sri Lanka',
'Sudan',
'Tanzania',
'Thailand',
'The Bahamas',
'Tonga',
'Tunisia',
'Turkey',
'Uganda',
'Ukraine',
'United Arab Emirates',
'Uruguay',
'Uzbekistan',
'Vietnam',
'Zambia'