経済データ処理実習 第7講 「経済格差を測ってみよう(1)」
|
T.不平等度の測定 | |
U.ローレンツ曲線の意味と性質 | |
V.累積百分率の計算 | |
※ 作図のポイント | |
練習問題1. | 練習問題2. |
T.不平等度の測定
前回計算した変動係数は,データ集合のバラツキを測定するものでした.
これは,例えば,体重のデータやテストの点数のデータ,所得データなどの
様々な単位のデータ集合のバラツキを測るのには,とても便利な尺度です.
しかし,今回使うような所得階層別のデータ集合を用いてグループ内の所得格差,
つまり不平等があるかどうか,を測定することはできません.
そもそも,「どういう状態が不平等なのか?」という点についての議論は,
経済学において非常に重要な問題なのですが,それについてはアトキンソンやセンなどの
厚生経済学者の著書を読んだり,「不平等の経済学」という講義などで勉強してください.
今回は,ローレンツ曲線とジニ係数を用いて,不平等度を測定します.
これらは,厚生経済学によって考え出された最もメジャーな尺度です.
ローレンツ曲線とジニ係数は,図を使うと次のように表されます.
![]() |
![]() |
縦横の最大値を100%にした正方形において,傾き45°の線を「均等分布線」,
赤い曲線を「ローレンツ曲線」と呼びます.これらの線で囲まれた弓形@の面積の,
@とAからなる三角形の面積に対する比率が「ジニ係数」です.
このジニ係数は,データ集合の不平等が大きいほど大きな値となり,
不平等が小さいほど小さい値になります.
完全に平等な状態であれば,均等分布線とローレンツ曲線が重なり,ジニ係数は0になります.
ジニ係数についての理解を深めるために,数値例を用いてローレンツ曲線の意味と性質を
まとめておきます.まず,下表のようなデータ集合は,均等分布(完全に平等)であると考えます.
(厳密には,各階級内でバラツキがあるかもしれません)
表1 階級 世帯数 階級内平均月収 T 25世帯 25万円 U 25世帯 25万円 V 25世帯 25万円 W 25世帯 25万円 合計 100世帯 100万円
これを図で描くと...
図1 | |
![]() |
![]() |
図中の「累積百分率」については後で説明します.
次に,表2のケースを考えてみましょう.
表2 階級 世帯数 階級内平均月収 累積月収 累積百分率 T 25世帯 15万円 15万円 9.37% U 25世帯 25万円 40万円 25% V 25世帯 40万円 80万円 50% W 25世帯 80万円 160万円 100% 合計 100世帯 160万円 − −
図2 | |
![]() |
![]() |
このように,表2の列では,4つの階級の世帯数が等しいのですが,
階級間で所得に格差があります.世帯数と所得額の累積百分率をプロットすれば,
上のようなローレンツ曲線が描けます.
ローレンツ曲線は,階級間での所得格差が大きくなればなるほど,
右下の方へ拡がりますし,低所得階級の世帯シェアが大きくなっても,同じく右下方向へ
拡がります.
図中に出てきた「累積百分率」とは,各「階級」の世帯数や所得を文字通り「累積」させ,
それを世帯数合計や所得合計で割ったものです.
表2にあるように,「累積」は次のようにして計算しています.(世帯数の場合も同じです)
第1階級の累積月収=第1階級の月収
第2階級の累積月収=第1階級の月収+第2階級の月収
第3階級の累積月収=第1階級の月収+第2階級の月収+第3階級の月収
最後の階級の累積月収=すべての階級の月収の合計
この累積値を使って,例えば第2階級の累積百分率であれば,
第2階級の累積百分率=(第2階級の累積値)/すべての階級の合計値
となります.この計算で行くと表2を見ても分かるように,最後の階級の累積百分率は100%です.
※練習問題1.
Excelシート上で,下表を作って空欄を埋め,グラフウィザードで散布図を選択し
ローレンツ曲線を描きなさい.
2つの表でのローレンツ曲線の拡がり具合を比べてみましょう.
表2 | ||||||
階級 | 世帯数(世帯) | 階級内平均月収(万円) | 累積世帯数 | 累積月収額 | 世帯累積百分率 | 月収累積百分率 |
T | 25 | 15 | ||||
U | 25 | 25 | ||||
V | 25 | 40 | ||||
W | 25 | 80 | ||||
合計 | 100 | 160 | − | − | − | − |
表3 | ||||||
階級 | 世帯数(世帯) | 階級内平均月収(万円) | 累積世帯数 | 累積月収額 | 世帯累積百分率 | 月収累積百分率 |
T | 45 | 15 | ||||
U | 25 | 25 | ||||
V | 20 | 40 | ||||
W | 10 | 80 | ||||
合計 | 100 | 160 | − | − | − | − |
※作図のポイント
(1)XとYを間違えないように!
散布図を描く場合,X軸の数値とY軸の数値を設定しなければいけません.
ローレンツ曲線を描く場合に限らず,どちらに何を入力するかを間違えないように!
今回の場合は,「世帯累積百分率」をX値とします.
(2)均等分布線を描くには...
無くても良いのですが,あるとより一層分かりやすいです.
これを同じグラフ上に描くには,まずどこか適当なセルに,以下を入力しておきます.
0 0 0.25 0.25 0.5 0.5 0.75 0.75 1 1
つまり,世帯累積百分率と月収累積百分率が同じになっているデータセットです.
このデータセットを,第5講でやった「グラフ系列の追加」の要領で,ローレンツ曲線の
グラフに追加します.
(3)軸の目盛りの修正
最後に細かいことですが,X軸とY軸の目盛りを修正しておきましょう.
両軸とも,Excelが勝手に軸の最大目盛りを120%にしてしまっています.
「軸の書式設定」を使って最大値を100%に設定しなおしましょう.
※練習問題2.
「家計調査.xls」の各年代のSheetのデータを使って,ローレンツ曲線を描きなさい.