統計学の自習:標準偏差とZ値

■標準偏差に対する疑問
 標準偏差=標本の分布の「ばらつき」を示す表す数値。・・・で、それに結局どんな利用価値があるのかイマイチよくわかってなかった。例えば平均値は、平均より高いとか低いとか、平均値を使って標本それぞれがどういうポジションにあるか考えられるけど、標準偏差はそういう風に使えないの?検定を勉強するついでに調べてみた。

■標準偏差の求め方
○一般式
 分散:SUM(標本の値-平均値)^2/標本数
 標準偏差:SQRT(分散)
○Excel関数
 VARP:分散を求める関数
 STDEVP:標準偏差を求める関数
 VAR:不偏分散を求める関数
 STDEV:不偏分散の標準偏差を求める関数

■標準偏差の意味
・標本の分布が正規分布に従っているとした場合(大体正規分布に従うものらしい)
・正規分布に従っているとき、平均に近い標本はたくさんあって、平均から遠ざかるほど標本数は少なくなる。
・この時、平均値からプラスマイナス標準偏差分の範囲の中に標本の68.3%が分布している。
・同様に、平均値からプラスマイナス標準偏差*2分の範囲の中に標本の95.5%が分布している。
・同様に、平均値からプラスマイナス標準偏差*3分の範囲の中に標本の99.7%が分布している。
・ということは、平均値プラスマイナス標準偏差*3の範囲の外にある標本は、何かの間違いかよっぽどの例外と考えることが出来る。

■Z値:標準化係数
・標本が平均値からどれぐらい離れたところに分布しているかを、標準偏差を単位として表した値。
・Z値:(標本の値-平均値)/標準偏差
・標本の分布が正規分布に従うとすると、Z値の絶対値が3を越えるようなデータはイレギュラーなデータと考えられる。

■偏差値
・偏差値はZ値を利用した数値。50+10*Zで求められる。
・偏差値が40~60の間はほぼダンゴ。7割の人がこの中にいる。
・偏差値70を越える人は全体の2.5%しかいない。100人でテストをしたら上から2-3人が偏差値70になる感じ。
・逆に偏差値30を下回るような人も全体の2.5%しかない。これはこれで滅多にないし、学力ではない才能があるに違いないとか思ってしまう。

■参考URL・文献
平均と標準偏差
・平均・分散・標準偏差(意味と応用)(pdfファイル)
完全独習 統計学入門