人工知能を作りたい!

統計的仮説検定

相関係数の検定(無相関検定)




はじめに

相関係数の検定を行う場合、帰無仮説を「母集団において2つの変数の相関は0である」と設定します。そのため、相関係数の検定は無相関検定とも呼ばれます。




例題

20人の学生に英単語テストと英文法テストの両方を受けてもらい以下の結果を得た。英単語テストの得点と英文法テストの得点を受験番号順にそれぞれ並べる。

<英単語テストの得点>
4, 5, 3, 7, 9, 7, 8, 3, 4, 7, 6, 5, 7, 8, 9, 10, 2, 5, 5, 7

<英文法テストの得点>
6, 7, 2, 8, 8, 5, 6, 6, 5, 8, 8, 5, 7, 9, 7, 7, 3, 8, 8, 7

英単語テストと英文法テストの相関係数の検定を行ってください。有意水準5%の両側検定とします。




帰無仮説と対立仮説の設定

帰無仮説 H0: ρ =0(母相関係数は0である)
対立仮説 H1: ρ ≠0(母相関係数は0ではない)
(母相関係数 ρ は「ロー」と呼びます。)




Rによる統計解析

関数 cor.test() を使って無相関検定を実行してみましょう。

関数 cor.test() の書式は
cor.test(変数1, 変数2)
です。

まず、関数 cor.test() に入力する2つの変数を作成しましょう。


> 英単語テスト <- c(4, 5, 3, 7, 9, 7, 8, 3, 4, 7, 6, 5, 7, 8, 9, 10, 2, 5, 5, 7)


英単語テストの得点を変数「英単語テスト」に格納します。


> 英文法テスト <- c(6, 7, 2, 8, 8, 5, 6, 6, 5, 8, 8, 5, 7, 9, 7, 7, 3, 8, 8, 7)


英文法テストの得点を変数「英文法テスト」に格納します。


> cor.test(英単語テスト, 英文法テスト)
        Pearson's product-moment correlation

data: 英単語テスト and 英文法テスト
t = 3.2175, df = 18, p-value = 0.004775
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.2207692 0.8259278
sample estimates:
      cor
0.6042571


「Pearson's product-moment correlation」は「ピアソンの積率相関係数」というタイトルです。

「data:」の横に検定の対象となる変数である「英単語テスト and 英文法テスト」が示されます。下の行に行くと、検定統計量 t の実現値、 t 分布の自由度、 p 値(デフォルトでは両側検定を行う)が示されます。

この検定統計量は、帰無仮説のもとで
自由度 df (degrees of freedom) = n -2=20-2=18
の t 分布に従います。サンプルサイズ n は、英単語テストと英文法テストの得点が20ペアあるのでn =20となります。

p値が0.004775となり、有意水準0.05より小さいので帰無仮説は棄却され、検定の結果は有意となります。

「alternative hypothesis: true correlation is not equal to 0」は、「対立仮説 H1: ρ ≠0(母相関係数は0ではない)」を示しています。これより、両側検定であることが分かります。

「95 percent confidence interval:」は、95%信頼区間の下限と上限の値を示しています。「sample estimates:」は、標本から計算された標本相関係数の実現値を示しています。標本相関係数 γ (ガンマ)の実現値は0.6042571ですので、「やや正の相関がある」となります。




関数 plot() を使って散布図を作ってみましょう。

関数 plot() の書式は
plot(x軸の変数, yの変数)
です。

> 英単語テスト <- c(4, 5, 3, 7, 9, 7, 8, 3, 4, 7, 6, 5, 7, 8, 9, 10, 2, 5, 5, 7)
> 英文法テスト <- c(6, 7, 2, 8, 8, 5, 6, 6, 5, 8, 8, 5, 7, 9, 7, 7, 3, 8, 8, 7)
> plot(英単語テスト, 英文法テスト)




標本相関係数 γ =0.604257ですので、「やや正の相関がある」を見てとれます。



ちなみに、標本相関係数 γ の値により2つの変数の相関は以下のようになります。

γ =0.7~1.0 → 強い正の相関がある
γ =0.4~0.7 → 中程度の正の相関がある
γ =0.2~0.4 → 弱い正の相関がある
γ =-0.2~0.2 → ほとんど相関がない
γ =-0.2~-0.4 → 弱い負の相関がある
γ =-0.4~-0.7 → 中程度の負の相関がある
γ =-1.0~-0.7 → 強い負の相関がある