統計学の自習:t検定について

■どんな時に使えるのか
 2つの標本の平均値に有意差があるか検定したい時に使う。それぞれの母集団がどちらも正規分布に従うと仮定した場合の検定方法。ノンパラメトリックな場合はマン・ホイットニーのU検定とか二項検定とかウィルコクソンの符号順位検定を使うらしい。

■自分がどんな時にt検定を使ったか
 複数回答できるアンケート調査で、年齢等によって回答数に有意差があるか検定するためにt検定を使った。くだけた言い方をすれば、年をとってる人の方が回答数が多いかどうかを調べるのに使った。

■t検定の種類
 t検定の方法は3種類ある。
・2つの標本の分散が等しい時のt検定。
・2つの標本の分散が等しくない時のt検定。
・2つの標本に対応がある時のt検定。

 同じ母集団から2つの標本を取り出す場合、対応があるという(ex.実験前と実験後を比べる時)。2つの標本の分散が等しいかを調べるためにはF検定を使う。

■Excelでt検定を行う
緑字は使用したExcel関数。灰字はExcel用に加工した一般式。
・2つの標本a,bを用意する。
・標本数a,bを数える(COUNTA:空白じゃないセルの数を数える関数)
・平均値a,bを求める(AVERAGE:平均値を求める関数)
・標本分散a,bを求める(VARP:分散を求める関数)
・F検定を行う(FTEST:F検定を行う関数)
 →0.05より大きければ等分散。0.05以下なら不等分散。

○等分散のt検定
・推定母分散を求める:(標本分散a*標本数a+標本分散b*標本数b)/(標本数a+標本数b-2)
・t値を求める:(標本平均a-標本平均b)/SQRT(推定母分散*(1/標本数a+1/標本数b))
・自由度を求める:標本数a+標本数b-2
 →自由度はTINV、TDIST関数で使用する。
・t境界値を求める(TINV:t境界値を求める関数、危険率は通常0.05か0.01)
 →t値の絶対値>t境界値なら有意差あり。
※P値を求める場合(TDIST:求めたt値の分布を求める関数。尾部は片側検定なら1、両側検定なら2)
 →P値<0.05or0.01なら有意差あり。

○不等分散のt検定
・不偏分散a,bを求める(VAR:不偏分散を求める関数)
・t値を求める:(標本平均a-標本平均b)/(不偏分散a/標本数a+不偏分散b/標本数b)
・自由度を求める:式が多少複雑なので分子と分母に分けて計算する
 分子:(不偏分散a/標本数a+不偏分散b/標本数b)^2
 分母:不偏分散a^2/(標本数a^2*(標本数a-1))+不偏分散b^2/(標本数b^2*(標本数b-1))
 →自由度は整数値をとるため、計算結果を小数点以下で四捨五入する。自由度はTINV、TDIST関数で使用する。
・t境界値を求める(TINV:t境界値を求める関数、危険率は通常0.05か0.01)
 →t値の絶対値>t境界値なら有意差あり。
※P値を求める場合(TDIST:求めたt値の分布を求める関数。尾部は片側検定なら1、両側検定なら2)
 →P値<0.05or0.01なら有意差あり。

■補足
○両側検定と片側検定
単に「有意差があるか」を検定する時は両側でいいらしい。「aの方が有意に大きい」というように、差がある方向まで検定したい時は片側検定を行うらしい。

■参考URL・文献
t検定 – Wikipedia
統計処理に使うExcel2007活用法―データ分析に使えるExcel実践テクニック (先輩が教えるseries 14)