第6講へ  講義内容へ  第8講へ

経済データ処理実習 第7講 「経済格差を測ってみよう(1)」

本日の内容:ローレンツ曲線の作成とジニ係数(1)


T.不平等度の測定
U.ローレンツ曲線の意味と性質
V.累積百分率の計算
※ 作図のポイント
練習問題1.  練習問題2.

T.不平等度の測定

 前回計算した変動係数は,データ集合のバラツキを測定するものでした.
これは,例えば,体重のデータやテストの点数のデータ,所得データなどの
様々な単位のデータ集合のバラツキを測るのには,とても便利な尺度です.
 しかし,今回使うような所得階層別のデータ集合を用いてグループ内の所得格差
つまり不平等があるかどうか,を測定することはできません.
 そもそも,「どういう状態が不平等なのか?」という点についての議論は,
経済学において非常に重要な問題なのですが,それについてはアトキンソンやセンなどの
厚生経済学者の著書を読んだり,「不平等の経済学」という講義などで勉強してください.

 今回は,ローレンツ曲線ジニ係数を用いて,不平等度を測定します.
これらは,厚生経済学によって考え出された最もメジャーな尺度です.
 ローレンツ曲線とジニ係数は,図を使うと次のように表されます.

テキスト ボックス: 所得金額累積百分率

 縦横の最大値を100%にした正方形において,傾き45°の線を「均等分布線」,
赤い曲線を「ローレンツ曲線」と呼びます.これらの線で囲まれた弓形@の面積の,
@とAからなる三角形の面積に対する比率が「ジニ係数」です.

   

 このジニ係数は,データ集合の不平等が大きいほど大きな値となり,
不平等が小さいほど小さい値になります.
 完全に平等な状態であれば,均等分布線とローレンツ曲線が重なり,ジニ係数は0になります.

U.ローレンツ曲線の意味と性質

 ジニ係数についての理解を深めるために,数値例を用いてローレンツ曲線の意味と性質を
まとめておきます.まず,下表のようなデータ集合は,均等分布(完全に平等)であると考えます.
(厳密には,各階級内でバラツキがあるかもしれません)

表1
階級 世帯数 階級内平均月収
T 25世帯 25万円
U 25世帯 25万円
V 25世帯 25万円
W 25世帯 25万円
合計 100世帯 100万円

 これを図で描くと...

図1
テキスト ボックス: 所得額累積百分率

 図中の「累積百分率」については後で説明します.
 次に,表2のケースを考えてみましょう.

表2
階級 世帯数 階級内平均月収 累積月収 累積百分率
T 25世帯 15万円 15万円 9.37%
U 25世帯 25万円 40万円 25%
V 25世帯 40万円 80万円 50%
W 25世帯 80万円 160万円 100%
合計 100世帯 160万円
図2
テキスト ボックス: 所得額累積百分率

 このように,表2の列では,4つの階級の世帯数が等しいのですが,
階級間で所得に格差があります.世帯数と所得額の累積百分率をプロットすれば,
上のようなローレンツ曲線が描けます.
 ローレンツ曲線は,階級間での所得格差が大きくなればなるほど,
右下の方へ拡がりますし,低所得階級の世帯シェアが大きくなっても,同じく右下方向へ
拡がります. 

V.累積百分率の計算

 図中に出てきた「累積百分率」とは,各「階級」の世帯数や所得を文字通り「累積」させ,
それを世帯数合計や所得合計で割ったものです.
 表2にあるように,「累積」は次のようにして計算しています.(世帯数の場合も同じです)

 第1階級の累積月収=第1階級の月収
 第2階級の累積月収=第1階級の月収+第2階級の月収
 第3階級の累積月収=第1階級の月収+第2階級の月収+第3階級の月収

    

 最後の階級の累積月収=すべての階級の月収の合計

 この累積値を使って,例えば第2階級の累積百分率であれば,

 第2階級の累積百分率=(第2階級の累積値)/すべての階級の合計値

となります.この計算で行くと表2を見ても分かるように,最後の階級の累積百分率は100%です.

※練習問題1.
 Excelシート上で,下表を作って空欄を埋め,グラフウィザードで散布図を選択し
ローレンツ曲線を描きなさい.
 2つの表でのローレンツ曲線の拡がり具合を比べてみましょう.

表2
階級 世帯数(世帯) 階級内平均月収(万円) 累積世帯数 累積月収額 世帯累積百分率 月収累積百分率
T 25 15        
U 25 25        
V 25 40        
W 25 80        
合計 100 160


表3
階級 世帯数(世帯) 階級内平均月収(万円) 累積世帯数 累積月収額 世帯累積百分率 月収累積百分率
T 45 15        
U 25 25        
V 20 40        
W 10 80        
合計 100 160

※作図のポイント
(1)XとYを間違えないように!
  散布図を描く場合,X軸の数値とY軸の数値を設定しなければいけません.
 ローレンツ曲線を描く場合に限らず,どちらに何を入力するかを間違えないように!
  今回の場合は,「世帯累積百分率」をX値とします.

(2)均等分布線を描くには...
  無くても良いのですが,あるとより一層分かりやすいです.
 これを同じグラフ上に描くには,まずどこか適当なセルに,以下を入力しておきます.

0 0
0.25 0.25
0.5 0.5
0.75 0.75
1 1

 つまり,世帯累積百分率と月収累積百分率が同じになっているデータセットです.
 このデータセットを,第5講でやった「グラフ系列の追加」の要領で,ローレンツ曲線の
グラフに追加します.

(3)軸の目盛りの修正 
 最後に細かいことですが,X軸とY軸の目盛りを修正しておきましょう.
両軸とも,Excelが勝手に軸の最大目盛りを120%にしてしまっています.
「軸の書式設定」を使って最大値を100%に設定しなおしましょう.

※練習問題2.
 「家計調査.xls」の各年代のSheetのデータを使って,ローレンツ曲線を描きなさい.


第6講へ  講義内容へ  第8講へ