第2講へ  講義内容へ  第4講へ


経済データ処理実習 第3講 「これぞ表計算!」

本日の内容:関数機能を利用した表計算


T.準備と前回のおさらい
U.関数の利用(合計,平均,最大値,最小値,中間値) → 練習問題1.
V.散らばりの尺度(分散と標準偏差) → 練習問題2.
W.偏差値の計算 → 練習問題3.

T.準備と前回のおさらい

 まず,今日の実習の準備と前回のおさらいをします.
(1)準備−「From Teacher」フォルダの利用−
  実習に使うための色々なデータは,From Teacherフォルダにあります.
 各自で自分のパソコンの「マイドキュメント」などにコピーして利用してください.
 手順:「マイコンピューター」 → 「‘wnf’のReportFolder(X:)」 → From Teacher
     → 菅原宏太(経済)

         

 菅原宏太(経済)フォルダの中に,「経済データ処理」というフォルダがあるので,それを開きます.
 中に,「県民経済計算.xls」というExcelファイルがあるので,それを右クリックしてコピーし,
 自分のパソコンの「マイドキュメント」などに貼り付けてください.

(2)前回のおさらい−オートフィル機能での連番付け−
  コピーした「県民経済計算.xls」を開くと,都道府県名と各都道府県の1人当たり県民所得のデータが出てきます.
 ここで,都道府県名の隣に連番付けをしましょう.
  A列を選択して,新しい列を挿入し,空白列を作ります.前回のおさらいで,
 北海道から順番に1,2,3,...と番号をつけましょう.

U.関数の利用(合計,平均,最大値,最小値,中間値)

 これらの説明は省略します.
(1)まず,沖縄の下にそれぞれを入力しておきましょう.

(2)次に,合計から求めます.
 合計と書いたセルの隣のセルを選択し,ツールバーの「Σ」マークの横の▼をクリック,
 出てきたプルダウン・メニューから「合計(S)」をクリック.

 すると,合計と書いたセルの隣が右下図のようになります.
“=SUM”というのが,「合計します」という意味です.その後のカッコ内はデータの範囲です.
(B4:B51)となっていますので,「B4セルからB51セルまでの数値を合計します」というのが
ここの意味です.
このままでも構わないのですが,データはB50までなのでデータの範囲を修正しておきましょう.

 簡単ですね.もし地道に,=B4+B5+B6+...なんてやって合計を出していたら,
日が暮れてしまいます.

※練習問題1.
 同様の手順で,平均,最大,最小,中間値を計算しましょう.
 また,平成9年度,10年度,11年度についてもやってみましょう.

  中間値はちょっと面倒です.プルダウン・メニューの「その他の機能(F)」を選び,
 「関数の検索(S)」で中間値を検索し,出てきた候補の中から“MEDIAN”を選んでください.
 データ範囲を聞いてきますので,合計などと同様にB4からB50を設定してください.

V.散らばりの尺度(分散と標準偏差)

 これらの統計量は,経済格差を測るときに,もう一度詳しく説明します.
簡単に言うと,分散も標準偏差も,データ集合(ここで言えば47個の都道府県データ)の散らばり具合を
計るものです.
 
 まず個々のデータの散らばりは“偏差”で計ることができます.
偏差とは,個々のデータと平均値との乖離です.
(偏差は各データにつき,1つ出てくるので47都道府県データであれば,47の偏差が出てきます)

 では,この偏差をまとめれば,データ集合の散らばり具合が分かるかと言うと,残念ながらそうは行かず,
偏差の合計は,平均値の性質により0になってしまいます.
(「ホント?」と思う人は確かめてみてください)

 そこで,この偏差を2乗して平均をとり,それを「分散」と呼んで散らばりの尺度として用います.
(次式から分かるように,分散はデータ集合につき,1つです.)

        

 ところが,この分散,偏差を2乗していますので,単位も元のデータの2乗になってしまいます.
つまり,ここで扱っている1人当たり県民所得データの単位は千円ですが,(だから平均値は千円です)
分散は1000の2乗で,百万円となってしまいます.
 「これでは良くない」ということで,(なぜ良くないかは,統計学や計量経済学の講義でならってください)
この分散の平方根(√)をとり,「標準偏差」と呼び,一般的な散らばりの尺度として用います.

       

 では,分散と標準偏差を計算してみましょう.
 1.まず,先ほど入力した中間値の下に,「分散」,「標準偏差」と入力しましょう.

 2.次に,先ほど中間値を求めた要領で,プルダウン・メニューの「その他の機能(F)」を選び,
  「関数の検索(S)」で,分散(または標準偏差)を検索し,出てきた候補の中から下図のものを
  選びます. 

  ○分散は“VAR”                     ○標準偏差は“STDEV”

   

 ○ここで,範囲の指定を忘れずに! 指定は数値1という欄に直接入力しても良いし,
  下図の赤丸部分をクリックすると,マウスのドラッグで表から自分で選ぶこともできます.

  

※練習問題2.
 平成7年度以外のデータについても,分散と標準偏差を出してみましょう.

W.偏差値の計算

  タイトルを見て,嫌なイメージを持った人は多いと思います...
 しかし,偏差値というのは,れっきとした統計量の1つなのです.
 例えば...
  社会科のテストとして日本史と世界史を選べたとしましょう.100人の生徒のうち,
 60人は日本史を受け,残りの40人は世界史を受けたとします.
  その時,社会科の成績として,生の100人の点数を比較できるかと言うのそれはダメです.
 もし,日本史のテストはすごく簡単で,世界史のテストがすごく難しかったとしたら,
 世界史を受けた40人にとって,そんな成績の付け方は不利です.

  こうした,状況の異なるものを比較するときに使うのが偏差値です.
 (もう少し詳しく言うと,偏差値とは「データの標準化」の応用です)

  今回使っている都道府県データで,偏差値はどのように使えるかと言うと...
  例えば,平成7年度の北海道の1人当たり県民所得は277.5万円ですが,
 平成11年度には271.5万円に減少しています.これは,平成11年度の方が不況が深刻化している
 からでしょう.
  ただ,不況の影響は多かれ少なかれ他県にも及んでいるわけですから,他県の県民所得も
 減少している可能性があります.
  ここで,偏差値の登場です.
  北海道の平成7年度と11年度の偏差値を求めて比較してみます.
 もし,11年度の偏差値が7年度よりも下がっていれば,「北海道は他県より不況のダメージが大きい」
 と言えます.
 逆に,偏差値が上がっていれば,「不況が深刻になっている中でも北海道は他県よりはマシ」
 と言えます.

 説明が長くなりましたが,それでは偏差値を求めてみましょう.
 1.まず,平成7年度の横2列に新しく列を挿入します.(D,E列を選択して右クリックから「挿入(I)」)
  新しくできた列に,「標準化」,「偏差値」と入力しておきましょう.

 2.次に,「標準化」という作業をします.北海道の標準化のセルを選択しておいて,関数を挿入します.
  (中間値,分散,標準偏差を求めたやり方と同じです)
  関数の検索欄には「標準化」と入力し,出てきた候補の中から“STANDARDIZE”を選択.

 3.すると,次に幾つかの設定をしなければいけません.
  ・まず,「X」は標準化したい数値ですから,北海道の平成7年度のデータのセル(C7セル)
  を選びます.
  ・「平均」と「標準偏差」は,さっき出したものが使えますから,それぞれに該当するセルを選びます.
  ※このとき絶対参照にしておきましょう!

 4.一つできれば後はカンタン.おなじみの■を下方へ沖縄県のデータまでドラッグして行きます.

 5.次に,再び北海道へ戻り,今求めた標準化変量(と呼びます)に,10を掛けて50を足します
  数式データは下図のように入力します.それから他県へコピーします.

※練習問題3.
 以上の作業を,平成11年度のデータについてもやってみましょう.
 そして,平成7年度と11年度の偏差値を比較してみましょう.
 (1)北海道はどうなっていますか? そこから何が言えますか?
 (2)東京はどうなっていますか? そこから何が言えますか?
 (3)京都はどうなっていますか? そこから何が言えますか?
 (4)あなたの実家の都道府県はどうですか?


第2講へ  講義内容へ  第4講へ