10. 비모수적 가설검정

10.1 한 모집단 위치모수의 검정

7장의 모평균 가설검정은 소표본의 경우 모집단이 정규분포라고 가정할 수 있는 경우에 $t$분포를 이용하였다. 이와 같이 모집단의 분포에 대한 가정을 하고 표본 데이터를 이용하여 모수에 대해 검정하는 방법을 모수적 검정(parametric test)이라 부른다. 8장의 두 모집단 모수의 가설검정과 9장의 여러 모집단 평균을 비교하는 분산분석도 모집단이 정규분포라고 가정을 하는 모수적 검정방법이다.

하지만 현실 데이터에는 모집단이 정규분포를 따른다는 가정이 맞지 않거나, 정규분포를 가정하기에는 표본의 수 등이 충분치 않을 경우가 있다. 또는 수집된 데이터가 연속형 데이터가 아니고 순위와 같은 순서식 데이터라면 모수적 검정은 적절하지 않다. 이러한 경우 모집단의 분포에 대한 가정을 하지 않고 데이터를 부호나 순위 등으로 변환하여 모수에 대한 검정을 하는 방법을 분포무관(distribution-free) 또는 비모수적 검정(nonparametric test)이라 부른다.

비모수적 검정은 데이터를 부호(sign)나 순위(rank) 등으로 변환하여 검정하기 때문에 데이터에 관한 정보의 손실이 있을 수 있다. 따라서 모집단이 정규분포를 따르는 데이터는 굳이 비모수적 검정을 적용할 이유가 없다. 실제로 모집단이 정규분포를 따를 때, 동일한 유의수준에서 비모수적 방법이 더 높은 2종오류의 확률을 가진다. 하지만 데이터가 정규분포를 따르지 않는 모집단에서 추출되었다면 비모수적 방법이 더 적절한 방법이 될 것이다.

7장의 모평균 가설검정은 표본평균의 표집분포에 대한 중심극한정리 등의 이론을 이용하였다. 하지만 비모수적 검정은 모집단의 중심위치모수(central location parameter)에 대하여 데이터 값들이 작은지 큰지 조사하여 부호 데이터를 만들어 그 분포를 이용하거나(10.1.1절의 부호검정), 데이터의 순위를 계산하여 중심위치모수보다 작거나 큰 순위에 대한 분포를 이용한다(10.1.2절의 윌콕슨 부호순위합검정). 여기서 중심위치모수란 모평균이나 모집단의 중앙값이 될 수 있는데 대개 데이터의 순위 변환에 영향을 받지 않는 중앙값을 지칭한다.

모집단의 중심위치모수에 관한 추정도 비모수적 방법으로 할 수 있으나 이 장에서는 비모수적 가설검정만 소개한다. 추정에 관심 있는 사람은 관련 문헌을 참조하기 바란다.

10.1.1 부호검정

다음의 예를 가지고 부호검정(sign test)을 살펴보자..

 

[예 10.1.1] 어느 과자제품의 겉봉지에 용량이 200g이라 표시되어 있다. 여러 소매점에서 이 과자 10개를 구입하여 무게를 조사하니 다음과 같다.

203 204 197 195 201 205 198 199 194 207

과연 표시된 용량만큼 과자가 들어있다고 할 수 있는가?

1) 모수적 방법으로 가설검정을 할 수 있는지 데이터의 히스토그램을 그려보라.

2) 부호를 이용하는 비모수적 방법으로 가설검정을 하라. 유의수준 5%.

3)『eStatU』를 이용하여 위의 부호검정 결과를 확인하라.

<풀이>

1) 이 문제에 대해서는 다음과 같이 모평균(${\rm \mu}$)에 대한 두 개의 가설을 세울 수 있다.

$H_{0}\ :\ \mu=200$ $H_{1}\ :\ \mu\ne 200$

표본이 10개인 소표본이라 모수적 방법으로 가설을 검정하기 위해서는 모집단이 정규분포라는 가정이 필요하다. 과연 표본 데이터가 이러한 가정을 만족하는지 살펴보기 위하여 『eStat』에 <그림 10.1.1>과 같이 데이터를 입력한다.

[그림 10.1.1] 과자 무게 데이터 입력
실습

 

모평균 가설검정 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 무게를 선택하면 평균-신뢰구간 점그래프가 나타난다(<그림 10.1.2>). 다시 그래프 밑의 선택사항에서 ‘히스토그램’ 버튼을 누르면 <그림 10.1.3>과 같은 히스토그램이 나타난다. 히스토그램을 살펴보면 데이터의 수가 작아서 모집단이 정규분포를 따른다고 가정하기에는 충분치 못하다. 이러한 경우 모수적 가설검정인 $t$검정을 적용하면 오류를 범할 수 있다.

[그림 10.1.2] 과자 무게의 평균-신뢰구간 그래프
[그림 10.1.3] 과자 무게의 히스토그램과 정규분포

2) 이와 같은 경우 표본 데이터를 과자 용량 200g 보다 큰지($+$표시) 아닌지($-$표시)만 조사하여 다음과 같이 부호 데이터로 변환할 수 있다.

표본 데이터

203

204

197

195

201

205

198

199

194

207

부호 데이터

$+$

$+$

$-$

$-$

$+$

$+$

$-$

$-$

$-$

$+$

만일 $+$의 개수와 $-$의 개수가 비슷하다면 대략 과자 용량 200g이 맞을 것이다. 만일 $+$의 개수가 더 많다면 200g보다 큰 것을 의미하고, $-$의 개수가 더 많다면 200g보다 작은 것을 의미하게 된다.

위의 부호 데이터는 200보다 크고 작은 것만을 조사하기 때문에 평균이라는 개념은 사용하지 않아 이 문제에 대해서는 다음과 같이 모집단 중앙값($M$)에 대한 두개의 가설을 설정하는 것이 좋다.

$H_{0}\ :\ M=200$  $H_{1}\ :\ M\ne 200$

위의 부호 데이터에서 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$ (또는 $n_{-}=’-{\rm 부호의}\ {\rm 갯수}’$)는 $n=10$, $p=0.5$인 이항분포(<그림 10.1.4>)를 따른다.

<그림 10.1.4> $n=10$, $p=0.5$인 이항분포

따라서 $H_{0}$가 맞다면 $+$부호의 개수는 5가 제일 많이 나타날 수 있고 0, 1 또는 9, 10은 나타날 확률이 매우 적다. 유의수준 5%로 귀무가설 $H_{0}\ :\ M=200$의 양측검정 기각역은 분포 양쪽 끝의 확률이 2.5%가 되어야 하므로 대략 다음과 같다.

만일 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$가 0 또는 1 이거나 (왼쪽 누적확률 0.011), 9 또는 10 이면 (오른쪽 누적확률 0.011) $H_{0}$기각

이 기각역은 유의수준이 $2\times 0.011=0.022$ 이므로 주어진 유의수준 0.05보다 작은 기각역이다. 이산형 분포인 이항분포를 이용하기 때문에 유의수준 5%와 정확하게 일치하는 기각역을 찾을 수 없는 경우가 많다. 한 값 안쪽으로 기각역을 설정하면

만일 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’\leq 2$이거나 (왼쪽 누적확률 0.055),  $\geq 8$이면 (오른쪽 누적확률 0.055) $H_{0}$기각

이 기각역은 유의수준이 $2\times 0.055=0.110$인 기각역이다. 그래서 경계선에 있는 값의 중간값 1.5나 8.5를 기준선으로 이용할 수도 있다.

만일 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}'<1.5$이거나, $>8.5$이면 $H_{0}$기각

이 방법도 근사적인 것이어서 이산형 분포인 경우 두 기각역 중에서 ‘어떤 것이 맞다’라고 할 수는 없고 분석자가 유의수준 근처에서 기준선을 선택하여야 한다. 이 예의 경우에는 어느 기각역이라도 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$가 5이므로 $H_{0}$는 기각할 수 없다. 즉, 과자 용량의 중앙값은 200g이라 할 수 있다.

3)『eStatU』에서 <그림 10.1.5>와 같이 데이터를 입력한 후 ‘실행’ 버튼을 누르면 <그림 10.1.6>과 같은 검정결과를 보여준다. 여기서는 유의수준 5%(양측검정의 경우 2.5%)가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

<그림 10.1.5> 『eStatU』부호검정 데이터 입력

<그림 10.1.6> 『eStatU』를 이용한 부호검정 결과

일반적으로 모집단의 중앙값을 $M$이라 할 때 부호검정은 이 중앙값이 특정한 값 $M_{0}$인지 아니면 이보다 크거나, 작은지, 같지 않은지 등을 검정하는 것이다. 하지만 모집단의 분포가 평균에 대해 대칭인 경우 중앙값과 평균이 같으므로 부호검정은 모평균의 검정이 된다.

부호검정의 검정통계량은 표본 데이터가 $n$개일 때 이 중에서 $M_{0}$보다 큰 데이터의 수, 즉, $+$부호 데이터의 수를 사용한다. 확률변량 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$는 모수가 $n$과 $p=0.5$인 이항분포 $B(n,0.5)$를 따르므로 부호검정은 이항분포를 이용하여 검정한다. $n_{-}=’-{\rm 부호의}\ {\rm 갯수}’=n-n_{+}$도 이항분포를 따르므로 검정에 사용할 수 있는데 여기서는 $n_{+}$를 이용한다. $B(n,0.5)_{{\rm \alpha}}$는 이항분포의 우측 $100\times{{\rm \alpha}}\%$백분위수를 의미하는데 이산형 분포여서 정확한 백분위수를 구할 수 없는 경우가 많아 대략 $B(n,0.5)_{{\rm \alpha}}$ 근처의 두 수 중간값을 이용하기도 한다. 표 10.1.1은 부호검정가설의 종류별로 선택기준을 요약한 것이다.

표 10.1.1 중앙값의 부호검정

가설의 종류

선택기준

검정통계량 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$

1) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M> M_{0}$

$n_{+}> B{\left({n,0.5}\right)}_{\alpha}$이면  $H_{0}$기각

2)$H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M< M_{0}$

$n_{+}< B{\left({n,0.5}\right)}_{1-\alpha}$이면  $H_{0}$기각

3) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M\ne M_{0}$

$n_{+}< B{\left({n,0.5}\right)}_{1-\alpha /2}$이면 $H_{0}$기각 또는

$n_{+}> B{\left({n,0.5}\right)}_{\alpha /2}$이면  $H_{0}$기각

5장의 정규분포에서 연구하였듯이 $n$이 충분히 커지게 되면 이항분포 $B(n,0.5)$는 정규분포 $N(0.5n,\ 0.5^{2}n)$에 근사하게 된다. 따라서 대표본의 경우 검정통계량 $n_{+}=’+{\rm 부호}\ {\rm 데이터의}\ {\rm 수}’$는 정규분포 $N(0.5n,\ 0.5^{2}n)$를 이용하여 검정할 수 있다. 표 10.1.2는 대표본의 경우 부호검정의 가설 종류별로 선택기준을 요약한 것이다.

표 10.1.2 중앙값의 부호검정 (대표본의 경우)

가설의 종류

선택기준

검정통계량 $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$

1) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M> M_{0}$

${{n_{+}-0.5n}\over{\sqrt{0.25n}}}> z_{\alpha}$이면 $H_{0}$기각

2) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M< M_{0}$

${{n_{+}-0.5n}\over{\sqrt{0.25n}}}<-z_{\alpha}$이면 $H_{0}$기각

3) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M\ne M_{0}$

$\left|{{{n_{+}-0.5n}\over{\sqrt{0.25n}}}}\right|> z_{\alpha /2}$이면 $H_{0}$기각

관측값 중에 ${\bf M}_{{\bf 0}}$와 동일한 값이 있으면?

만약 관측값 중에 $M_{0}$와 동일한 값이 있으면 그 관측값은 검정에서 사용하지 않는다. 즉, $n$을 감소시킨다.

10.1.2 윌콕슨 부호순위합검정

앞 절에서 다룬 부호검정은 표본 데이터를 M_{0}$보다 작은지 큰지를 조사하여 부호 $+$와 $-$로 변환하였다. 이 경우 원래의 표본 데이터가 가지는 정보를 많이 잃어버리게 된다. 윌콕슨 부호순위합검정(Wilcoxon signed-rank sum test)은 표본 데이터에서 $M_{0}$를 뺀 값에 대하여 순위 데이터로 변환한 후 $M_{0}$보다 큰 순위의 합과 작은 순위의 합을 비교하는 방법이다. 즉, 부호순위합검정은 표본 데이터가 $M_{0}$보다 크고 작음 뿐만 아니라 데이터의 상대적인 크기도 고려하여 검정을 실시하는 방법으로서, 한 모집단 위치모수의 검정에 가장 널리 사용되는 비모수적 검정법이다.

다음의 예를 가지고 부호순위합검정을 살펴보자.

 

[예 10.1.2] [예 10.1.1]의 다음 과자 무게 데이터를 이용하여 표시된 용량만큼 과자가 들어있다고 할 수 있는지 부호순위합검정을 하라? 유의수준 5%.

203 204 197 195 201 205 198 199 194 207

『eStatU』를 이용하여 위의 부호순위합검정 결과를 확인하라

<풀이>

이 문제에 대한 가설은 모집단 중앙값($M$)이 $M_{0}=200$g인지 아닌지를 검정하는 것이다.

$H_{0}\ :\ M=200$ $H_{1}\ :\ M\ne 200$

부호순위합 검정에서는 표본 데이터에 대하여 과자 용량 $M_{0}=200$g보다 큰지($+$ 표시) 아닌지($-$ 표시)를 조사하는 부호 이외에 다음과 같이 $\left|{{\rm 데이터}-200}\right|$의 순위(rank)를 계산한다. 이때 동점값이 발생하면 평균 순위를 이용한다. 예를 들어, $\left|{{\rm 데이터}-200}\right|$값이 제일 작은 1인 값이 2개 있으므로 이에 해당하는 순위 1, 순위 2의 평균을 낸 순위 1.5를 부여한다.

$ {{\rm 표본}\ {\rm 데이터}} $

203

204

197

195

201

205

198

199

194

207

$ {{\rm 부호}\ {\rm 데이터}} $

$+$

$+$

$-$

$-$

$+$

$+$

$-$

$-$

$-$

$+$

$|{\rm 데이터}-200|$

3

4

3

5

1

5

2

1

6

7

$|{\rm 데이터}-200|\ {\rm 순위}$

4.5

6

4.5

7.5

1.5

7.5

3

1.5

9

10

$R_{+}=29.5$

$=$4.5

$+$6

$+$1.5

+7.5

$+$10

전체 순위합은 $1+2+\cdots+10=10(10+1)/2=55$ 이다. 만일 $+$의 부호를 갖는 데이터(과자 용량 200g 보다 큰 데이터)의 순위합 $R_{+}$와 $-$의 부호를 갖는 데이터(과자 용량 200g 보다 작은 데이터)의 순위합 $R_{-}$를 비교하여 비슷하다면(대략 28 근처) 귀무가설인 $M=200$g이 맞을 것이다. 이 예제에서 $R_{+}=29.5$이고 $R_{-}=25.5$이다. $+$ 순위합이 $-$ 순위합보다 크므로 과자 무게가 200g보다 큰 것이 우세한 것으로 보인다. 어느 정도 큰 값이 통계적으로 유의할까?

무가설이 맞는 경우 어느 정도 큰 값이 통계적으로 유의한지 조사하기 위해서는 확률변량 $R_{+}=’+{\rm 순위합}’$ (또는 $R_{-}=’-{\rm 순위합}’$)의 분포를 알아야 한다. $H_{0}$가 사실일 경우 $R_{+}$의 경우의 수는 표 10.1.3과 같다. 이러한 가능한 순위합을 모두 조사하여 분포표를 만들기는 쉽지 않다. 『eStatU』에는 <그림 10.1.7>과 같이 윌콕슨 부호순위합 분포를 보여주고 표로 정리하여 준다(표 10.1.4).

표 10.1.3 경우의 수

+ 부호 데이터의 개수

가능한 순위의 조합

가능한 순위합

0개

 $0$

 $0$

1개

 $1,2,\cdots ,10$

 $1,2,\cdots ,10$

2개

$\cdots$

$\cdots$

$\cdots$

10개

$\left\{{1,2,\cdots ,10}\right\}$

$55$

<그림 10.1.7> $n=10$인 경우의 윌콕슨 부호순위합 분포표 그림

표 10.1.4 $n=10$인 경우의 윌콕슨 부호순위합 분포

윌콕슨 부호순위합 분포

$n=10$

$X$

$P(X=x)$

$P(X\leq x)$

$P(X\geq x)$

0

0.0010

0.0010

1.0000

1

0.0010

0.0020

0.9990

2

0.0010

0.0029

0.9980

3

0.0020

0.0049

0.9971

4

0.0020

0.0068

0.9951

5

0.0029

0.0098

0.9932

6

0.0039

0.0137

0.9902

7

0.0049

0.0186

0.9863

8

0.0059

0.0244

0.9814

9

0.0078

0.0322

0.9756

$\cdots$

$\cdots$

$\cdots$

$\cdots$

46

0.0078

0.9756

0.0322

47

0.0059

0.9814

0.0244

48

0.0049

0.9863

0.0186

49

0.0039

0.9902

0.0137

50

0.0029

0.9932

0.0098

51

0.0020

0.9951

0.0068

52

0.0020

0.9971

0.0049

53

0.0010

0.9980

0.0029

54

0.0010

0.9980

0.0020

55

0.0010

1.0000

0.0010

유의수준이 5%일 때 양측검정이므로 양쪽끝 2.5% 백분위수를 찾으면 $P(X\leq 8)=0.0244$, $P(X\geq 47)=0.0244$이다. 이산형 분포이므로 2.5% 백분위수의 정확한 값은 없다. 그러므로 기각역은 다음과 같이 정할 수 있다.

‘만일 $R_{+}\leq 8.5$또는 $R_{+}\geq 46.5$이면 $H_{0}$기각’

이 문제에서는 $R_{+}=29.5$이므로 $H_{0}$를 기각할 수 없다.

3)『eStatU』에서 데이터를 입력한 후(<그림 10.1.8>) ‘실행’ 버튼을 누르면 표본통계량이 계산되고 <그림 10.1.9>와 같은 검정결과를 보여준다. 여기서는 유의수준 5%(양 끝의 확률이 각각 2.5%)가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

<그림 10.1.8> 『eStatU』부호순위합검정 데이터 입력

<그림 10.1.9> 『eStatU』를 이용한 부호순위합검정 결과

『eStat』으로 부호순위합검정을 실시할 수도 있다. <그림 10.1.10>과 같이 데이터를 입력하고 모평균 가설검정 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 무게를 선택하면 평균-신뢰구간 점그래프가 나타난다(<그림 10.1.11>).

<그림 10.1.10> 『eStat』 데이터 입력

 

실습

 

<그림 10.1.11> 과자 무게의 평균-신뢰구간 그래프

다시 그래프 밑의 선택사항에서 $\mu_{0}$값으로 200을 입력하고 ‘윌콕슨 부호순위합검정’ 버튼을 누르면 <그림 10.1.9>와 동일한 검정결과 그래프와 결과표(<그림 10.1.12>) 가 나타난다.

<그림 10.1.12> 윌콕슨 부호순위합검정 결과표

일반적으로 모집단의 중앙값을 $M$이라 할 때 부호순위합검정은 이 중앙값이 특정한 값 $M_{0}$인지 아니면 이보다 크거나, 작은지, 같지 않은지 등을 검정하는 것이다. 하지만 모집단의 분포가 평균에 대해 대칭인 경우 중앙값과 평균이 같으므로 부호순위합검정은 모평균의 검정이 된다. 기본적인 모형은 다음과 같다.

$X_{i}=M_{0}+\varepsilon_{i}$, $i=1,2,\cdots ,n$(10-1)

여기서 $\varepsilon_{i}$는 서로 독립이며 0에 대하여 대칭인 동일한 분포를 따른다.

부호순위합검정의 검정통계량은 표본 데이터가 $x_{1},x_{2},…,x_{n}$일 때 먼저 $|x_{i}-M_{0}|$의 순위를 계산한다. 이 중에서 $M_{0}$보다 큰 데이터, 즉, $+$부호 데이터의 $|x_{i}-M_{0}|$ 순위합을 사용한다. 확률변량 $R_{+}=’+{\rm 부호}\ {\rm 데이터의}\ {\rm 순위합}’$의 분포는 모든 경우의 수를 조사하여 구하는데 $w_{+}(n)$으로 표시한다. 『eStatU』를 이용하면 $n=22$까지의 윌콕슨 부호순위합 $w_{+}(n)$분포표를 쉽게 구할 수 있다. $w_{+}(n)_{{\rm \alpha}}$는 이 분포의 우측  $100\times{{\rm \alpha}}\%$백분위수를 의미하는데 이산형 분포여서 정확한 백분위수를 구할 수 없는 경우가 많아 대략 $w_{+}(n)_{{\rm \alpha}}$근처의 두 수 중간값을 이용하기도 한다. 표 10.1.5는 가설의 종류별로 윌콕슨 부호순위합검정 선택기준을 요약한 것이다.

표 10.1.5 중앙값의 윌콕슨 부호순위합검정

가설의 종류

선택기준

검정통계량 $R_{+}=\left|{x_{i}-M_{0}}\right|$순위의 $+$부호 데이터의 순위합

1) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M{>} M_{0}$

$R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$이면 $H_{0}$ 기각

2) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M{<} M_{0}$

$R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$이면 $H_{0}$ 기각

3) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M\ne M_{0}$

$R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha /2}$이면 $H_{0}$기각 또는

$R_{+}{>} w_{+}{\left({n}\right)}_{\alpha /2}$이면  $H_{0}$기각

귀무가설이 사실인 경우 표본이 충분히 크다면 검정통계량 $R_{+}$은 다음과 같은 평균 $E(R_{+})$와 분산 $V(R_{+})$을 갖는 정규분포에 근사한다.

$E(R_{+})={{n(n+1)}\over{4}}$ .  (10-2)

$V(R_{+})={{n(n+1)(2n+1)}\over{24}}$  (10-3)

표 10.1.6은 대표본의 경우 부호순위합검정의 가설 종류별로 선택기준을 요약한 것이다.

표 10.1.6 중앙값의 윌콕슨 부호순위합검정 (대표본의 경우)

가설의 종류

선택기준

검정통계량 $R_{+}=\left|{x_{i}-M_{0}}\right|$순위의 $+$부호 데이터의 순위합

1) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M{>} M_{0}$

${{R_{+}-E\left({R_{+}}\right)}\over{\sqrt{V\left({R_{+}}\right)}}}{>} z_{\alpha}$이면 $H_{0}$기각

2) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M{<} M_{0}$

${{R_{+}-E\left({R_{+}}\right)}\over{\sqrt{V\left({R_{+}}\right)}}}{<}-z_{\alpha}$이면 $H_{0}$기각

3) $H_{0}\ :\ M=M_{0}$

$H_{1}\ :\ M\ne M_{0}$

$\left|{{{R_{+}-E\left({R_{+}}\right)}\over{\sqrt{V\left({R_{+}}\right)}}}}\right|{>} z_{\alpha /2}$이면 $H_{0}$ 기각

$w_{+}(n)$의 분포는 모집단의 분포와 무관하다. 즉, 윌콕슨 부호순위합검정은 분포무관 검정법이다. 예를 들어, $n=3$일 때 $w_{+}(3)$의 분포는 다음과 같이 구할 수 있다.

순위

$R_{+}$의 가능한 순위

1

2

3

$-$

$-$

$-$

0

$+$

$-$

$-$

1

$-$

$+$

$-$

2

$-$

$-$

$+$

3

$+$

$+$

$-$

3

$+$

$-$

$+$

4

$-$

$+$

$+$

5

$+$

$+$

$+$

6

따라서 $w_{+}(3)$의 분포는 다음과 같이 관측값의 분포와 무관하게 주어진다.

$R_{+}=x$

0

1

2

3

4

5

6

$P(R_{+}=x)$

${{1}\over{8}}$

${{1}\over{8}}$

${{1}\over{8}}$

${{2}\over{8}}$

${{1}\over{8}}$

${{1}\over{8}}$

${{1}\over{8}}$

표본 중에서 $|x_{i}-M_{0}|$에 동점이 있는 경우에는 $|x_{i}-M_{0}|$의 순위를 구할 때 평균 순위를 사용하여 계산한다. 이 경우 대표본 근사를 사용하는 경우에는 $R_{+}$의 분산은 다음과 같이 수정하여 사용한다.

$V(R_{+})={{1}\over{24}}[n(n+1)(2n+1)-{{1}\over{2}}\sum\limits_{j=1}^{g}{t_{j}(t_{j}-1)(t_{j}+1)]}$ (10-4)

여기서

위 식에서 동점이 아닌 관측값은 크기 1인 동점 그룹으로 취급되어 $t_{j}=1$이 된다.

 

10.2 두 모집단의 위치모수 비교 검정

8장의 두 모집단의 모평균에 대한 가설검정은 소표본의 경우 각 모집단이 정규분포라고 가정할 수 있는 경우에 $t$분포를 이용하였다. 하지만 현실 데이터에는 모집단이 정규분포를 따른다는 가정이 맞지 않거나, 정규분포를 가정하기에는 데이터 수 등이 충분치 않을 경우가 있다. 또는 수집된 데이터가 연속형 데이터가 아니고 순위와 같은 순서식 데이터라면 모수적 검정은 적절하지 않다. 이러한 경우 모집단의 분포에 대한 가정을 하지 않고 데이터를 순위 등으로 변환하여 모수에 대한 검정을 하는 비모수적 검정 방법이 사용된다. 이 절에서는 윌콕슨 순위합검정(Wilcoxon rank sum test)을 소개한다.

비모수적 검정은 데이터를 순위(rank) 등으로 변환하여 검정하기 때문에 데이터에 관한 정보의 손실이 있을 수 있다. 따라서 굳이 정규분포를 따르는 데이터는 비모수적 검정을 적용할 이유가 없다. 하지만 데이터가 정규분포를 따르지 않는 모집단에서 추출되었다면 비모수적 방법이 더 적절한 방법이 될 것이다.

이 절에서는 8장과 마찬가지로 각 모집단에서 표본을 독립적으로 추출한 경우와 대응 추출한 경우로 나누어 비모수적 검정을 소개한다.

10.2.1 독립표본: 윌콕슨 순위합검정

다음의 예를 가지고 윌콕슨 순위합검정을 살펴보자.

 

[예 10.2.1] 한 대학의 교수가 통계학과와 경영학과 학생을 대상으로 같은 데이터과학 과목을 가르치고 있다. 두 학과 학생의 점수가 같은지 비교해 보기 위하여 통계학과와 경영학과에서 각각 7명과 6명의 학생을 임의 표본추출하여 점수를 조사하였더니 다음과 같다.

통계학과 87 75 65 95 90 81 93

경영학과 57 85 90 83 87 71

1) 모수적 방법으로 가설검정을 할 수 있는지 데이터의 히스토그램을 그려보라.

2) 윌콕슨 순위합검정으로 가설검정을 하라. 유의수준 5%.

3)『eStat』을 이용하여 위의 순위합검정 결과를 확인하라.

 

<풀이>

1) 모수적 방법으로 가설검정을 하기 위해서 다음과 같이 모평균(${\rm \mu}$)에 대한 두 개의 가설을 세울 수 있다.

$H_{0}\ :\ {\rm \mu}_{1}={\rm \mu}_{2}$ $H_{1}\ :\ {\rm \mu}_{1}\ne{\rm \mu}_{2}$

표본이 각각 $n_{1}=7$개와 $n_{2}=6$개인 소표본이라 모수적 방법으로 가설을 검정하기 위해서는 모집단이 정규분포라는 가정이 필요하다. 과연 표본 데이터가 이러한 가정을 만족하는지 살펴보기 위하여 『eStat』에 <그림 10.2.1>과 같이 데이터를 입력한다.

<그림 10.2.1> 『eStat』데이터 입력

 

실습

 

두 모평균 가설검정 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 점수, ‘by 그룹’을 학과로 선택하면 <그림 10.2.2>와 같은 각 학과별 평균-신뢰구간 점그래프가 나타난다. 통계학과 학생들의 점수 평균이 경영학과 학생들의 점수 평균보다 높은 것으로 보이는데 이 차이가 통계적으로 유의한지는 검정하여야 한다. 다시 그래프 밑의 선택사항에서 ‘히스토그램’ 버튼을 누르면 <그림 10.2.3>과 같은 각 학과별 히스토그램과 정규분포 곡선이 나타난다.

<그림 10.2.2> 학과별 점수의 평균-신뢰구간 그래프

<그림 10.2.3> 학과별 점수의 히스토그램

히스토그램을 살펴보면 데이터의 수가 작아서 모집단이 정규분포를 따른다고 가정하기에는 충분치 못하다. 이러한 경우 모수적 가설검정인 $t$검정을 적용하면 오류를 범할 수 있다. 이 문제에 대한 가설은 두 모집단의 중앙값 $M_{1}$과 $M_{2}$가 같은지를 검정하는 것이다.

$H_{0}\ :\ M_{1}=M_{2}$ $H_{1}\ :\ M_{1}\ne M_{2}$

윌콕슨 순위합검정에서는 두 표본 전체에 대하여 순위(rank)를 먼저 계산한다. 이때 동점값이 있으면 평균 순위를 이용한다. 각 표본의 순위합 $R_{1}$과 $R_{2}$를 구하기 위해서는 표 10.2.1과 같이 데이터를 각각 정렬한 후 전체 순위를 정하면 편리하다.

표 10.2.1 각 표본의 순위합을 구하기 위한 표

표본 1 데이터 정렬

표본 2 데이터 정렬

표본 1 순위

표본 2 순위

57

1

65

2

71

3

75

4

81

5

83

6

87

85

7

90

87

8.5

8.5

93

90

10.5

10.5

95

12

13

위합

$R_{1}=55$

$R_{2}=36$

전체 순위합은 $1+2+\cdots+13=13(13+1)/2=91$ 이고 표본 1의 순위합은 $R_{1}=55$, 표본 2의 순위합은 $R_{2}=36$이다. 만일 표본의 수를 감안하였을 때 $R_{1}$과 $R_{2}$가 비슷하다면 두 모집단의 중앙값이 같다는 귀무가설이 채택될 것이다. 이 예의 경우 $R_{1}$이 $R_{2}$보다 크므로 모집단의 1의 중앙값이 커 보이는데 표본의 크기 등을 고려할 때 어느 정도 큰 값이 통계적으로 유의할까?

무가설이 맞는 경우 어느 정도 큰 값이 통계적으로 유의한지 조사하기 위해서는 확률변량 $R_{2}='{\rm 표본2}\ {\rm 순위합}’$(또는 $R_{1}='{\rm 표본1}\ {\rm 순위합}’$)의 분포를 알아야 한다. $H_{0}$가 사실일 경우 $R_{2}$의 경우의 수는 표 10.2.2 와 같이 $_{13}P_{6}=1716$이다. 이러한 가능한 순위합을 모두 조사하여 분포표를 만들기는 쉽지 않다. 『eStatU』에는 <그림 10.2.4>와 같이 윌콕슨 부호순위합 분포를 보여주고 표로 정리하여 준다.

표 10.2.2 $R_{2}$경우의 수

$R_{2}$의 가능한 순위의 조합

가능한 순위합 

$R_{2}$

$\{1,2,3,4,5,6\}$

21

$\{1,2,3,4,5,7\}$

22

$\cdots$

$\cdots$

$\{8,9,10,11,12,13\}$

63

<그림 10.2.4> $n_{1}=7$, $n_{2}=6$인 경우의 윌콕슨 순위합 분포표 그림

표 10.2.3 $n_{1}=7$, $n_{2}=6$인 경우의 윌콕슨 순위합 분포표

콕슨 순위합 분포

$n_{1}=7$

$n_{2}=6$

$X$

$P(X=x)$

$P(X\leq x)$

$P(X\geq x)$

21

0.0006

0.0006

1

22

0.0006

0.0012

0.9994

23

0.0012

0.0023

0.9988

24

0.0017

0.0041

0.9977

25

0.0029

0.007

0.9959

26

0.0041

0.0111

0.993

27

0.0064

0.0175

0.9889

28

0.0082

0.0256

0.9825

29

0.0111

0.0367

0.9744

$\cdots$

$\cdots$

$\cdots$

$\cdots$

55

0.0111

0.9744

0.0367

56

0.0082

0.9825

0.0256

57

0.0064

0.9889

0.0175

58

0.0041

0.993

0.0111

59

0.0029

0.9959

0.007

60

0.0017

0.9977

0.0041

61

0.0012

0.9988

0.0023

62

0.0006

0.9994

0.0012

63

0.0006

1

0.0006

유의수준이 5%일 때 양측검정이므로 양쪽끝 2.5% 백분위수를 찾으면 $P(X\leq 28)=0.0256$, $P(X\geq 56)=0.0256$이다. 이산형 분포이므로 2.5% 백분위수의 정확한 값은 없다. 그러므로 기각역은 다음과 같이 정할 수 있다.

‘만일 $R_{2}\leq 27.5$또는 $R_{2}\geq 56.5$이면 $H_{0}$기각’

이 문제에서는 $R_{2}=36$이므로 $H_{0}$를 기각할 수 없다. 즉, 순위합 $\R_{1}$과 $R_{2}$의 차이는 통계적으로 유의하지 않다.

3)『eStatU』에서 데이터를 입력한 후(<그림 10.2.5>) ‘실행’ 버튼을 누르면 표본통계량이 계산되고 검정결과 그래프를 보여준다(<그림 10.2.6>). 여기서는 유의수준 5%가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

<그림 10.2.5> 『eStatU』윌콕슨 순위합검정 데이터 입력

<그림 10.2.6> 『eStatU』윌콕슨 순위합검정 결과 그래프

『eStat』으로 순위합검정을 실시할 수도 있다. <그림 10.2.1>과 같이 데이터를 입력하고 두 모평균 가설검정 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 점수, ‘by 그룹’을 학과로 선택하면 <그림 10.2.2>의 평균-신뢰구간 점그래프가 나타난다. 그래프 밑의 선택사항에서 ‘윌콕슨 순위합검정’ 버튼을 누르면 검정 결과 그래프(<그림 10.2.6>과 동일)와 검정 결과표(<그림 10.2.7>)가 나타난다.

<그림 10.2.7> 윌콕슨 순위합검정 결과표

지금까지 설명한 윌콕슨 순위합검정을 일반화시켜 보자. 두 모집단에서 각각 독립적으로 추출된 크기가 $n_{1}$과 $n_{2}$인 확률표본을 다음과 같이 표시하자($n=n_{1}+n_{2}$).

표본 1 $X_{1},\ X_{2},\ \cdots ,\ X_{n_{1}}$

표본 2 $Y_{1},\ Y_{2},\ \cdots ,\ Y_{n_{2}}$

편의상 $n_{1}\geq n_{2}$라 가정하며 $n_{1}\leq n_{2}$인 경우에는 $X$와 $Y$를 서로 바꾸면 된다.

순위합검정의 기본 모형은 다음과 같다.

$X_{i}=M_{1}+\varepsilon_{i}$, $i=1,2,\cdots ,n_{1}$ (10-5)

$Y_{j}=M_{1}+\Delta+\varepsilon_{j}$, $j=1,2,\cdots ,n_{2}$, $M_{2}=M_{1}+\Delta$로 표시해도 좋음 (10-6)

여기서 $\Delta$는 위치모수의 차이를 의미하며 $\varepsilon_{i}$는 서로 독립이며 0에 대하여 대칭인 동일한 연속형 분포를 따른다.

윌콕슨 순위합검정의 검정통계량은 혼합표본 $X_{1},X_{2},\cdots ,X_{n_{1}}$, $Y_{1},Y_{2},\cdots ,Y_{n_{2}}$ 에 대하여 순위를 구하였을 때 $Y_{1},Y_{2},\cdots ,Y_{n_{2}}$에 대한 순위합 $R_{2}$이다. 확률변량 $R_{2}$= ‘$Y$표본에 부여한 순위합‘의 분포는 $_{n}P_{n_{2}}$모든 경우의 수를 조사하여 구하는데 $w_{2}(n_{1},n_{2})$으로 표시한다. 『eStatU』를 이용하면 $n=25$까지의 윌콕슨 순위합 분포표 $w_{2}(n_{1},n_{2})$를 쉽게 구할 수 있다. $w_{2}(n_{1},n_{2})_{{\rm \alpha}}$는 이 분포의 우측 $100\times{{\rm \alpha}}\%$백분위수를 의미하는데 이산형 분포여서 정확한 백분위수를 구할 수 없는 경우가 많아 대략 $w_{2}(n_{1},n_{2})_{{\rm \alpha}}$근처의 두 수의 중간값을 이용하기도 한다. 표 10.2.4는 가설의 종류별로 윌콕슨 순위합검정 선택기준을 요약한 것이다.

표 10.2.4 윌콕슨 순위합검정

가설의 종류

선택기준

검정통계량 $R_{2}=’Y{\rm 표본에}\ {\rm 부여한}\ {\rm 순위합}’$

1) $H_{0}\ :\ M_{1}=M_{2}$

$H_{1}\ :\ M_{1}{>} M_{2}$

$R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\alpha}$이면  

$H_{0}$기각

2) $H_{0}\ :\ M_{1}=M_{2}$

$H_{1}\ :\ M_{1}{<}M_{2}$

$R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\alpha}$이면 

$H_{0}$기각

3) $H_{0}\ :\ M_{1}=M_{2}$

$H_{1}\ :\ M_{1}\ne M_{2}$

$R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\alpha /2}$이면 

$H_{0}$기각 또는

$R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\alpha /2}$이면 

$H_{0}$기각

귀무가설이 사실인 경우 표본이 충분히 크다면 검정통계량 $R_{2}$는 다음과 같은 평균 $E(R_{2})$와 분산 $V(R_{2})$을 갖는 정규분포에 근사한다.

$E(R_{2})={{n_{2}\left({n_{1}+n_{2}+1}\right)}\over{2}}$(10-7)

$V(R_{2})={{n_{1}n_{2}\left({n_{1}+n_{2}+1}\right)}\over{12}}$ (10-8)

표 10.2.5는 대표본의 경우 윌콕슨 순위합검정의 가설 종류별로 선택기준을 요약한 것이다.

표 10.2.5 윌콕슨 순위합검정 (대표본의 경우)

설의 종류

선택기준

검정통계량 $R_{2}=’Y{\rm 표본에}\ {\rm 부여한}\ {\rm 순위합}’$

1) $H_{0}\ :\ M_{1}=M_{2}$

$H_{1}\ :\ M_{1}{>} M_{2}$

${{R_{2}-E\left({R_{2}}\right)}\over{\sqrt{V\left({R_{2}}\right)}}}{>} z_{\alpha}$이면 

$H_{0}$기각

2) $H_{0}\ :\ M_{1}=M_{2}$

$H_{1}\ :\ M_{1}{<} M_{2}$

${{R_{2}-E\left({R_{2}}\right)}\over{\sqrt{V\left({R_{2}}\right)}}}{<}-z_{\alpha}$이면 

$H_{0}$기각

3) $H_{0}\ :\ M_{1}=M_{2}$

$H_{1}\ :\ M_{1}\ne M_{2}$

$\left|{{{R_{2}-E\left({R_{2}}\right)}\over{\sqrt{V\left({R_{2}}\right)}}}}\right|{>} z_{\alpha /2}$이면  $H_{0}$기각

순위합 통계량의 분포 $w_{2}(n_{1},n_{2})$는 모집단의 분포와 무관하다. 즉, 윌콕슨 순위합검정은 분포무관 검정법이다. 예를 들어, $n_{1}=3$이고  $n_{2}=2$일 때 분포 $w_{2}(3,2)$는 다음과 같이 구할 수 있다. 가능한 $R_{2}$의 경우의 수는 $_{5}P_{2}=10$이다.

혼합 표본 순위

$R_{2}$의 가능한 값

$X_{1}$

$X_{2}$

$X_{3}$

$Y_{1}$

$Y_{2}$

3

4

5

1

2

3

2

4

5

1

3

4

2

3

5

1

4

5

2

3

4

1

5

6

1

4

5

2

3

5

1

3

5

2

4

6

1

3

4

2

5

7

1

2

5

3

4

7

1

2

4

3

5

8

1

2

3

4

5

9

따라서 분포 $w_{2}(3,2)$는 다음과 같이 모집단의 분포와 무관하게 주어진다.

$R_{2}=x$

3

4

5

6

7

8

9

$P\left({R_{2}=x}\right)$

${{1}\over{10}}$

${{1}\over{10}}$

${{2}\over{10}}$

${{2}\over{10}}$

${{2}\over{10}}$

${{1}\over{10}}$

${{1}\over{10}}$

혼합 표본에서 동점이 있는 경우에는 순위를 구할 때 평균 순위를 사용하여 계산한다. 이 경우 대표본 근사를 사용하는 경우에는 $R_{2}$의 분산은 다음과 같이 수정하여 사용한다.

$V(R_{2})={{n_{1}n_{2}}\over{12}}\left[{n_{1}+n_{2}+1-{{\sum\limits_{j=1}^{g}{t_{j}\left({t_{j}-1}\right)\left({t_{j}+1}\right)}}\over{\left({n_{1}+n_{2}}\right)\left({n_{1}+n_{2}-1}\right)}}}\right]$(10-9)

여기서

위 식에서 동점이 아닌 관측값은 크기 1인 동점 그룹으로 취급되어 $t_{j}=1$이 된다.

10.2.2 대응표본: 윌콕슨 부호순위합검정

8.1.2절에서 두 모평균을 비교하는 경우 대응표본을 이용하는 가설검정에 대해서 알아보았다. 대응표본은 두 모집단에서 표본을 독립적으로 추출하기가 힘들거나, 독립적으로 추출하였을 때 각 표본개체의 특성이 너무 차이가 나서 결과분석이 무의미할 때 사용된다. 대응표본을 이용하는 검정은 두 모집단의 정규성이 만족되는 경우에 대응표본의 차이(difference) 데이터를 이용하여 8.1.2절과 같이 $t$검정을 이용할 수 있다. 하지만 모집단의 정규성이 만족된다고 볼 수 없는 경우에는 차이 데이터를 이용하여 10.1.2절의 비모수적 검정방법인 윌콕슨 부호순위합검정(Wilcoxon signed-rank sum test)을 한다.

대응표본일 경우에는 먼저 표 10.2.6과 같이 $n$쌍(pair)의 표본에 대한 차이($d_{i}$)를 계산한다. 이 차이 데이터에 대해 모수적 검정이 가능한지 정규성 여부 등을 살펴보고, 만족된다고 볼 수 없는 경우 윌콕슨 부호순위합검정을 적용한다. 다음 예를 살펴보자.

표 10.2.6 대응비교를 위한 데이터와 통계량

모집단 1의 표본($x_{i1}$)

모집단 2의 표본($x_{i2}$)

차이 $d_{i}=x_{i1}-x_{i2}$

$x_{11}$

$x_{12}$

$d_{1}=x_{11}-x_{12}$

$x_{21}$

$x_{22}$

$d_{2}=x_{21}-x_{22}$

$\cdots$

$\cdots$

$\cdots$

$x_{n1}$

$x_{n2}$

$d_{n}=x_{n1}-x_{n2}$

 

[예 10.2.2] 8쌍의 젊은 부부를 표본추출해서 나이를 조사한 결과가 아래와 같다.

(남, 여)

(28, 28) (30, 29) (34, 31) (29, 32) (28, 29) (31, 33) (39, 35) (34, 29)

1) 차이 데이터를 만들어 모수적 검정이 가능한지 히스토그램을 그려 살펴보라.

2) 평균적으로 아내가 남편보다 젊다고 할 수 있는지 윌콕슨 부호순위합검정을 하라. 유의수준 0.05.

2)『eStat』를 이용하여 위의 부호순위합검정 결과를 확인하라

<풀이>

1) 남자와 여자의 나이 차이 데이터틀 만들면 다음과 같다.

표 10.2.7 남자와 여자의 차이 데이터

번호

남자($x_{i}$)

여자($y_{i}$)

차이 $d_{i}=x_{i}-y_{i}$

1

28

28

0

2

30

29

1

3

34

31

3

4

29

32

-3

5

28

29

-1

6

31

33

-2

7

39

35

4

8

34

29

5

이 차이 데이터에 대해 『eStat』을 이용하여 히스토그램(모평균 가설검정 아이콘 이용)을 그려보면 <그림 10.2.8>과 같다. 히스토그램을 살펴보면 데이터의 수가 적어 정규분포를 따른다는 충분한 근거가 되지는 못한다. 이러한 경우 모수적 가설검정인 $t$검정을 적용하면 오류를 범할 수 있다. 이 문제에 대한 적절한 비모수적 방법은 차이 데이터를 이용한 윌콕슨 부호순위합검정이다.

<그림 10.2.8> 남자와 여자 차에 대한 히스토그램

2) 이 문제에 대한 가설은 남녀 모집단의 나이에 대한 중앙값 $M_{1}$과 $M_{2}$가 같은지를 검정하는 것이다.

$H_{0}\ :\ M_{1}=M_{2}$ $H_{1}\ :\ M_{1}\ne M_{2}$

하지만 대응표본이어서 차이에 대한 중앙값($M_{d}$)이 0 인지에 대한 윌콕슨 부호순위합검정을 한다.

$H_{0}\ :\ M_{d}=0$ $H_{1}\ :\ M_{d}\ne 0$

부호순위합검정에서는 차이 데이터에 대하여 $M_{0}=0$보다 큰지( $+$표시) 아닌지(${-}$표시) 조사하고 다음과 같이 $|{\rm 데이터}-0|$의 순위(rank)를 계산한다. 이때 차이 데이터가 0인 것은 제외하고(첫 번째 데이터) 동점값이 발생하면(여기서 1) 평균 순위(1과 2의 평균 1.5)를 이용한다.

${{\rm 데이터}} $

1

3

-3

-1

-2

4

5

${{\rm 부호}\ {\rm 데이터}}$

$+$

$+$

${-}$

${-}$

${-}$

$+$

$+$

$|{\rm 데이터}-0|$

1

3

3

1

2

4

5

$|{\rm 데이터}-0|\ {\rm 순위}$

1.5

4.5

4.5

1.5

3

6

7

$R_{+}=19$

$=$1.5

$+$4.5

$+$6

$+$7

『eStatU』에서  $n=7$인 경우 윌콕슨 부호순위합 분포를 살펴보면 <그림 10.2.9>와 표 10.2.8과 같다.

<그림 10.2.9> $n=7$인 경우의 윌콕슨 부호순위합 분포

표 10.2.8  $n=7$인 경우의 윌콕슨 부호순위합 분포표

윌콕슨 부호순위합 분포

$n=7$

$x$

$P(X=x)$

$P(X\leq x)$

$P(X\geq x)$

0

0.0078

0.0078

1.0000

1

0.0078

0.0156

0.9922

2

0.0078

0.0234

0.9844

3

0.0156

0.0391

0.9766

4

0.0156

0.0547

0.9609

$\cdots$

$\cdots$

$\cdots$

$\cdots$

24

0.0156

0.9609

0.0547

25

0.0156

0.9766

0.0391

26

0.0078

0.9844

0.0234

27

0.0078

0.9922

0.0156

28

0.0078

1.0000

0.0078

유의수준이 5%일때 양측검정이므로 양쪽끝 2.5% 백분위수를 찾으면 $P(X\leq 2)=0.0234$, $P(X\geq 26)=0.0234$이다. 이산형 분포이므로 2.5% 백분위수의 정확한 값은 없다. 그러므로 기각역은 다음과 같이 정할 수 있다.

만일 $R_{+}\leq 2.5$또는 $R_{+}\geq 25.5$이면 $H_{0}$기각

이 문제에서는 $R_{+}=19$이므로 $H_{0}$를 기각할 수 없다.

3)『eStat』에서 데이터를 <그림 10.2.10>과 같이 입력한 후 모평균 가설검정 을 선택한다. 변량1을 선택하면 평균-신뢰구간 그래프가 나타나고 그래프 선택사항에서 ${\rm \mu}_{0}$를 0으로 입력하고 ‘실행’ 버튼을 누르면 <그림 10.2.11> 및 <그림 10.2.12>와 같은 검정결과를 보여준다. 여기서는 유의수준 5%가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

<그림 10.2.10> 『eStat』의 차이 데이터 입력

실습

 

<그림 10.2.11> 『eStat』부호순위합검정 결과

<그림 10.2.12> 윌콕슨 부호순위합검정 결과

대응표본에 대한 윌콕슨 부호순위합검정은 두 모집단 차이의 중앙값 $M_{d}$가 0 인지 검정하는 것이다. 대응표본을 $(x_{1},y_{1}),(x_{2},y_{2}),\cdots ,(x_{n},y_{n})$로 표시할 때 부호순위합검정은 먼저 차이 $d_{i}=x_{i}-y_{i}$를 계산한 후 $|d_{i}|$의 순위를 계산한다. 이 중에서 0 보다 큰 데이터, 즉, $+$부호 데이터의 $|d_{i}|$순위합을 사용한다. 확률변량 $R_{+}=’+{\rm 부호}\ {\rm 데이터의}\ {\rm 순위합}’$의 윌콕슨 부호순위합 분포 $w_{+}(n)$은 『eStatU』를 이용하여 $n=22$까지 구할 수 있다. $w_{+}(n)_{{\rm \alpha}}$는 이 분포의 우측 $100\times{{\rm \alpha}}\%$ 백분위수를 의미하는데 이산형 분포여서 정확한 백분위수를 구할 수 없는 경우가 많아 대략 $w_{+}(n)_{{\rm \alpha}}$근처의 두 수의 중간값을 이용하기도 한다. 표 10.2.9는 가설의 종류별로 대응표본에 대한 윌콕슨 부호순위합검정 선택기준을 요약한 것이다.

표 10.2.9 대응표본의 윌콕슨 부호순위합검정

가설의 종류

선택기준

검정통계량 $R_{+}=’\left|{d_{i}}\right|\ {\rm 순위에서}+{\rm 부호}\ {\rm 데이터의}\ {\rm 순위합}’$

1) $H_{0}\ :\ M_{d}=0$

$H_{1}\ :\ M_{d}{>} 0$

$R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$이면  $H_{0}$기각

2) $H_{0}\ :\ M_{d}=0$

$H_{1}\ :\ M_{d}{<} 0$

$R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$이면 

$H_{0}$기각

3) $H_{0}\ :\ M_{d}=0$

$H_{1}\ :\ M_{d}\ne 0$

$R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha /2}$이면 

$H_{0}$기각 또는

$R_{+}{>} w_{+}{\left({n}\right)}_{\alpha /2}$이면 

$H_{0}$기각

대응표본이 대표본일 경우 표 10.1.6과 같은 정규분포 근사공식을 이용한다.

10.3 여러 모집단의 위치모수 비교 검정

9장의 여러 모집단의 모평균에 대한 비교 검정은 각 모집단이 정규분포이고 모분산이 같다고 가정할 수 있는 경우에 $F$ 분포를 이용하였다. 하지만 현실 데이터에는 모집단이 정규분포를 따른다는 가정이 맞지 않거나, 정규분포를 가정하기에는 데이터 수 등이 충분치 않을 경우가 있다. 또는 수집된 데이터가 연속형 데이터가 아니고 순위와 같은 순서식 데이터라면 모수적 검정은 적절하지 않다. 이러한 경우 모집단의 분포에 대한 가정을 하지 않고 데이터를 순위 등으로 변환하여 모수에 대한 검정을 하는 비모수적 검정(nonparametric test) 방법이 사용된다. 이 절에서는 9장의 한 인자 분산분석에서 완전확률화계획법 실험에 해당하는 크루스칼–왈리스 검정(Kruskal-Wallis test)과 확률화블록계획법 실험에 해당하는 프리드만 검정(Friedman test)을 소개한다.

비모수적 검정은 데이터를 순위(rank) 등으로 변환하여 검정하기 때문에 데이터에 관한 정보의 손실이 있을 수 있다. 따라서 굳이 정규분포를 따르는 데이터는 비모수적 검정을 적용할 이유가 없다. 하지만 데이터가 정규분포를 따르지 않는 모집단에서 추출되었다면 비모수적 방법이 더 적절한 방법이 될 것이다.

10.3.1 일원분산분석: 크루스칼–왈리스 검정

크루스칼–왈리스 검정은 두 모집단의 윌콕슨 순위합검정을 확장한 것인데 다음 예를 살펴보자.

[예 10.3.1] 세 회사의 사원들을 표본 추출하여 직업만족도를 조사한 결과가 다음과 같다. 이 자료로부터 세 회사의 직업만족도가 다르다고 할 수 있는가?

회사 A 69 67 65 59

회사 B 56 63 55

회사 C 71 72 70

1) 세 회사의 평균 직업만족도가 비교를 모수적 방법으로 검정을 할 수 있는지 데이터의 히스토그램을 그려보라.

2) 비모수적 방법인 크루스칼–왈리스 검정을 이용하여 세 회사의 직업만족도가 다르다고 할 수 있는지 검정을 하라. 유의수준 5%.

3)『eStat』을 이용하여 위의 크루스칼–왈리스 검정 결과를 확인하라.

<풀이>

1) 세 모집단의 평균이 같은지 가설을 검정하는 모수적 방법은 9장에서 연구한 일원분산분석이고 모집단이 정규분포라는 가정이 필요하다. 표본이 각각 $n_{1}=4$, $n_{2}=3$, $n_{3}=3$개인 소표본이라 과연 표본 데이터가 이러한 가정을 만족하는지 살펴보기 위하여 『eStat』에 <그림 10.3.1>과 같이 데이터를 입력한다.

<그림 10.3.1> 『eStat』데이터 입력

 

실습

 

분산분석 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 점수, ‘by 그룹’을 회사로 선택하면 <그림 10.3.2>와 같은 각 회사별 평균-신뢰구간 점그래프가 나타난다. 회사 C의 만족도점수가 점수가 높고 회사 A, 회사 B 순이다. 하지만 이차이가 통계적으로 유의한지는 검정하여야 한다. 다시 그래프 밑의 선택사항에서 ‘히스토그램’ 버튼을 누르면 <그림 10.3.3>과 같은 각 회사별 히스토그램과 정규분포 곡선이 나타난다.

<그림 10.3.2> 회사별 점수의 평균-신뢰구간 그래프순위합 분포
<그림 10.3.3> 회사별 만족도 점수의 히스토그램

히스토그램을 살펴보면 데이터의 수가 작아서 모집단이 정규분포를 따른다고 가정하기에는 충분치 못하다. 이러한 경우 모수적 가설검정인 $F$검정을 적용하면 오류를 범할 수 있다. 이 문제에 대한 가설은 세 모집단의 위치모수 $M_{1}$, $M_{2}$, $M_{3}$가 같은지를 검정하는 것이다.

$H_{0}\ :\ M_{1}=M_{2}=M_{3}$ $$H_{1}\ :\ {\rm 적어도}\ {\rm 한쌍}\ {\rm 이상의}\ {\rm 위치모수가}\ {\rm 다름}$

크루스칼–왈리스 검정은 세 표본 전체 혼합표본에 대하여 순위(rank)를 먼저 계산한 후 각 표본의 순위합 $R_{1},\ R_{2},\ R_{3}$를 계산한다. 이때 동점값이 있으면 평균 순위를 이용한다. 크루스칼–왈리스 검정통계량 $H$ 는 표본 데이터를 순위 데이터로 변환하여 $F$검정통계량과 유사한 것을 유도한 것으로 다음과 같다.

$H={{12}\over{n(n+1)}}\sum\limits_{j=1}^{3}{{{R{_{j}}^{2}}\over{n_{j}}}-3(n+1)}$

각 표본의 순위합을 구하기 위해서는 표 10.3.1과 같이 데이터를 각각 정렬한 후 전체 순위를 정하면 편리하다.

표 10.3.1 각 표본의 순위합을 구하기 위한 표

표본 1 데이터

정렬

표본 2 데이터

정렬

표본 3 데이터

정렬

표본 1

순위

표본 2

순위

표본 3

순위

55

1

56

2

59

3

63

4

65

5

67

6

69

7

70

8

71

9

72

10

위합

$R_{1}=21$

$R_{2}=7$

$R_{3}=27$

전체 순위합은 $1+2+\cdots+10=10(10+1)/2=55$이고 표본 1의 순위합은 $R_{1}=21$, 표본 2의 순위합은 $R_{2}=7$, 표본 3의 순위합은 $R_{3}=27$ 이다. 만일 표본의 수를 감안하였을 때 $R_{1}$, $R_{2}$, $R_{3}$가 비슷하다면 세 모집단의 위치모수가 같다는 귀무가설이 채택될 것이다. 이 예의 경우 표본 3의 데이터 수가 작은데도 불구하고 $R_{3}$가 $R_{1}$, $R_{2}$보다 크고, 또 $R_{1}$이 $R_{2}$보다 큰 데 표본의 크기 등을 고려할 때 세 모집단의 위치모수가 통계적으로 다른 것으로 유의할까?

위의 예에서 $H$ 검정통계량은 다음과 같다.

$H={{12}\over{10\left({10+1}\right)}}\left({{{21^{2}}\over{4}}+{{7^{2}}\over{3}}+{{27^{2}}\over{3}}}\right)-3(10+1)=7.318$

귀무가설이 맞는 경우 어느 정도 큰 값이 통계적으로 유의한지 조사하기 위해서는 검정통계량 $H$의 분포를 알아야 한다. $n=10$일 때 $H$의 경우의 수는 10개 데이터 순위 $\{1,2,3,\cdots ,10\}$의 모든 순열인 $10!=3,628,800$이다. 이러한 가능한 순위합을 모두 조사하여 $H$분포표를 만들기는 쉽지 않다. 『eStatU』에는 <그림 10.3.4>와 같이 $n_{1}=4$, $n_{2}=3$, $n_{3}=3$인 경우에 크루스칼–왈리스 분포를 보여주고 분포표(표 10.3.2)를 정리하여 준다. 그림에서 보듯이 $H$분포는 비대칭 분포이다.

<그림 10.3.4> $n_{1}=4$, $n_{2}=3$, $n_{3}=3$인 경우의 크루스칼–왈리스 분포

표 10.3.2 $n_{1}=4$, $n_{2}=3$, $n_{3}=3$인 경우의 크루스칼–왈리스 분포표

크루스칼–왈리스 $H$분포

$k=3$

$n_{1}=4$

$n_{2}=3$

$n_{3}=3$

$x$

$P(X=x)$

$P(X\leq x)$

$P(X\geq x)$

0.018

0.0162

0.0162

1.0000

0.045

0.0133

0.0295

0.9838

0.118

0.0295

0.0590

0.9705

0.164

0.0162

0.0752

0.9410

0.200

0.0295

0.1048

0.9248

$\cdots$

$\cdots$

$\cdots$

$\cdots$

5.573

0.0029

0.9495

0.0533

5.727

0.0048

0.9543

0.0505

5.791

0.0095

0.9638

0.0457

5.936

0.0019

0.9657

0.0362

5.982

0.0076

0.9733

0.0343

6.018

0.0019

0.9752

0.0267

6.155

0.0019

0.9771

0.0248

6.300

0.0057

0.9829

0.0229

6.564

0.0033

0.9862

0.0171

6.664

0.0010

0.9871

0.0138

6.709

0.0029

0.9900

0.0129

6.745

0.0038

0.9938

0.0100

7.000

0.0019

0.9957

0.0062

7.318

0.0019

0.9976

0.0043

7.436

0.0010

0.9986

0.0024

8.018

0.0014

1.0000

0.0014

$H$검정은 우측검정이다. 유의수준이 5%일 때 오른쪽 5% 백분위수를 찾으면 $P(X\geq 5.727)=0.0505$이다. 이산형 분포이므로 5% 백분위수의 정확한 값은 없다. 그러므로 기각역은 다음과 같이 정할 수 있다.

‘만일 $H>5.727$ 이면 $H_{0}$기각’

이 문제에서는 $H=7.318$이므로 $H_{0}$를 기각한다.

3)『eStatU』에서 데이터를 입력한 후(<그림 10.3.5>) ‘실행’ 버튼을 누르면 표본통계량이 계산되고 <그림 10.3.6>과 같은 검정결과를 보여준다. 여기서는 유의수준 5%가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

<그림 10.3.5> 크루스칼–왈리스 검정을 위한 데이터 입력

<그림 10.3.6> 『eStatU』를 이용한 크루스칼–왈리스 검정 결과

『eStat』으로 크루스칼–왈리스 $H$검정을 실시할 수도 있다. <그림 10.3.1>과 같이 데이터를 입력하고 분산분석 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 점수, ‘by 그룹’을 회사로 선택하면 <그림 10.3.2>의 평균-신뢰구간 점그래프가 나타난다. 그래프 밑의 선택사항에서 ‘크루스칼–왈리스 검정’ 버튼을 누르면 <그림 10.3.6>과 동일한 검정결과 그래프와 검정결과표(<그림 10.3.7>)가 나타난다.

<그림 10.3.7> 크루스칼–왈리스 검정 결과표

지금까지 예를 들어 설명한 크루스칼–왈리스 $H$ 검정을 일반화하여 보자. $k$개의 모집단(한 인자의 각 수준)에서 각각 독립적으로 추출된 크기가 $n_{1},n_{2},\ldots ,n_{k}$인 확률표본을 다음과 같이 표시하자.($n=n_{1}+n_{2}+\cdots+n_{k}$).

표 10.3.3 각 수준별 확률표본에 대한 기호

수준 1

수준 2

$\cdots$

수준

$X_{11}$

$X_{21}$

$\cdots$

$X_{k1}$

$X_{12}$

$X_{22}$

$\cdots$

$\cdots$

$\cdots$

$X_{k2}$

$X_{1n_{1}}$

$X_{2n_{2}}$

$X_{kn_{k}}$

수준 1 평균

수준 2 평균

$\cdots$

수준  $k$평균

총평균

${\bar X}_{1\cdot}$

${\bar X}_{2\cdot}$

${\bar X}_{k\cdot}$

${\bar X}_{\cdot\cdot}$

크루스칼–왈리스 검정의 기본 모형은 다음과 같다.

$X_{ij}={\rm \mu}+{\rm \tau}_{i}+\varepsilon_{ij}$, $i=1,2,\cdots ,k$; $j=1,2,\cdots ,n_{i}$ 단, $\sum\limits_{i=1}^{k}{{\rm \tau}_{{\rm i}}}=0$  (10-10)

여기서 ${\rm \tau}_{i}$는 수준 $i$의 효과를 의미하며 $\varepsilon_{ij}$는 서로 독립이며 동일한 연속형 분포를 따른다.

검정의 귀무가설은 다음과 같다.

$H_{0}\ :\ {\rm \tau}_{1}={\rm \tau}_{2}=\cdots={\rm \tau}_{k}=0$(10-11)

$H_{1}\ :\ {\rm 적어도}\ {\rm 하나의}\ {\rm \tau}_{i}{\rm 는}\ {\rm 0이}\ {\rm 아니다}$(10-12)

크루스칼–왈리스 검정을 위해서는 전체 혼합표본에 대한 순위 데이터를 만들어야 한다. 표 10.3.4는 각 수준별 순위 데이터의 기호이다.

표 10.3.4 각 수준별 순위 데이터에 대한 기호

수준 1

수준 2

$\cdots$

수준 $k$

$R_{11}$

$R_{21}$

$\cdots$

$R_{k1}$

$R_{12}$

$R_{22}$

$R_{k2}$

$\cdots$

$\cdots$

$\cdots$

$R_{1n_{1}}$

$R_{2n_{2}}$

$R_{kn_{k}}$

준 1 합

준 2 합

$\cdots$

준 합

$R_{1\cdot}$

$R_{2\cdot}$

$R_{k\cdot}$

준 1 평균

준 2 평균

$\cdots$

준 평균

평균

${\bar R}_{1\cdot}$

${\bar R}_{2\cdot}$

${\bar R}_{k\cdot}$

${\bar R}_{\cdot\cdot}=\left({n+1}\right)/2$

표 10.3.4의 순위 데이터에 대해 9장에서 연구한 일원분산분석의 제곱합을 계산하여 보면 다음과 같다.

$SST=\sum\limits_{i=1}^{k}{\sum\limits_{j=1}^{n_{i}}{(R_{ij}-{\bar R}_{\cdot\cdot})^{2}}}=\sum\limits_{k=1}^{n}{(}k-{\bar R}_{\cdot\cdot})^{2}=n(n+1)(n-1)$ (10-13)

$SSTr=\sum\limits_{i=1}^{k}{\sum\limits_{j=1}^{n_{i}}{({\bar R}_{i\cdot}-{\bar R}_{\cdot\cdot})^{2}}}$(10-14)

$SST=SSTr+SSE$(10-15)

$F$검정통계량은 다음과 같이 표시할 수 있다.

$F={{MSTr}\over{MSE}}={{{{SSTr}\over{k-1}}}\over{{{SSE}\over{n-k}}}}={{{{SSTr}\over{k-1}}}\over{{{SST-SSTr}\over{n-k}}}}={{{{n-k}\over{k-1}}}\over{{{SST}\over{SSTr}}-1}}$ (10-16)

즉, $SST$가 상수이므로 $F$ 검정통계량은 $SSTr$에 비례하는 값이다.

크루스칼–왈리스 검정통계량 $H$는 $SSTr$에 비례하는 통계량으로 다음과 같다.

$ {H={{12}\over{n(n+1)}}\sum\limits_{i=1}^{k}{n_{i}({\bar R}_{i\cdot}-{\bar R}_{\cdot\cdot})^{2}}}$

${={{12}\over{n(n+1)}}\sum\limits_{i=1}^{k}{R_{i\cdot}^{2}}-3(n+1)} $ (10-17)

$H$통계량의 정의에서 상수 ${{12}\over{n(n+1)}}\ $을 곱한 것은 이 통계량의 근사분포가 자유도가 $k-1$인 카이제곱분포가 되도록 하기 위한 것이다.

크루스칼–왈리스 검정통계량의 분포는 순위 $\{1,2,\cdots ,n\}$의 모든 경우의 수($n!$)를 조사하여 구하는데 $h(n_{1},n_{2},\cdots ,n_{k})$으로 표시한다. 『eStatU』를 이용하면 $n=10$까지의 크루스칼-왈리스 분포표 $h(n_{1},n_{2},\cdots ,n_{k})$를 쉽게 구할 수 있다. $h(n_{1},n_{2},\cdots ,n_{k})_{{\rm \alpha}}$는 이 분포의 우측  $100\times{{\rm \alpha}}\%$백분위수를 의미하는데 이산형 분포여서 정확한 백분위수를 구할 수 없는 경우가 많아 대략 $h(n_{1},n_{2},\cdots ,n_{k})_{{\rm \alpha}}$근처의 두 수의 중간값을 이용하기도 한다. 표 10.3.5는 크루스칼-왈리스 검정의 선택기준을 요약한 것이다.

표 10.3.5 크루스칼-왈리스 검정

가설

선택기준

검정통계량 $H$

$H_{0}\ :\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$

${H_{1}\ :\ {\rm 적어도}\ {\rm 하나의}\ \tau_{i}{\rm 는}\ {\rm 0이}\ {\rm 아니다}} $

$H>h(n_{1},\ n_{2},\ \cdots ,\ n_{k})_{\alpha}$이면 $H_{0}$기각

크루스칼-왈리스 통계량 $H$의 분포는 모집단의 분포와 무관하다. 즉, 크루스칼-왈리스 검정은 분포무관 검정법이다.

귀무가설이 사실인 경우 표본이 충분히 크다면 검정통계량 $H$는 자유도가 $k-1$인 카이제곱분포에 근사한다. 표 10.3.6은 대표본의 경우 윌콕슨 순위합검정의 선택기준을 요약한 것이다.

표 10.3.6 크루스칼-왈리스 검정 – 대표본의 경우

가설

선택기준

검정통계량 $H$

$H_{0}\ :\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$

$H_{1}\ :\ {\rm 적어도}\ {\rm 하나의}\ \tau_{i}{\rm 는}\ {\rm 0이}\ {\rm 아니다}$

$H>\chi_{k-1\ ;\ \alpha}^{2}$이면 $H_{0}$기각

혼합 표본에서 동점이 있는 경우에는 순위를 구할 때 평균 순위를 사용하여 계산한다. 이 경우 통계량 $H$는 다음과 같이 수정하여 사용한다.

$H’={{H}\over{1-\sum\limits_{j=1}^{g}{{{T_{j}}\over{n^{3}-n}}}}}$   (10-18)

여기서 $g=({\rm 동점}\ {\rm 그룹의}\ {\rm 수})$

$T_{j}=\sum\limits_{j=1}^{g}{t_{j}}\left({t_{j}-1}\right)\left({t_{j}+1}\right)$

$t_{j}=(j{\rm 번째}\ {\rm 동점}\ {\rm 그룹의}\ {\rm 크기,}\ {\rm 즉,}\ {\rm 동점}\ {\rm 그룹에}\ {\rm 포함된}\ {\rm 관측값의}\ {\rm 개수})$

위 식에서 동점이 아닌 관측값은 크기 1인 동점 그룹으로 취급되어 $t_{j}=1$이 된다.

10.3.2 이원분산분석: 프리드만 검정

9.2절에서 세 종류의 자동차 연비 측정에서는 운전자라는 블록 요인의 영향을 줄이기 위해 확률화블록계획법(randomized block design)으로 실험하는 방법을 연구하였다. 그리고 모집단이 정규분포를 따른다고 가정하고 측정된 데이터는 이원분산분석에 의한 $F$ 검정을 실시하였다. 하지만 현실 데이터에는 모집단이 정규분포를 따른다는 가정이 맞지 않거나, 정규분포를 가정하기에는 데이터 수 등이 충분치 않을 경우가 있다. 또는 수집된 데이터가 연속형 데이터가 아니고 순위와 같은 순서식 데이터라면 모수적 검정은 적절하지 않다. 이러한 경우 모집단의 분포에 대한 가정을 하지 않고 데이터를 순위 등으로 변환하여 모수에 대한 검정을 하는 비모수적 검정이 사용된다. 이 절에서는 9.2.2절의 확률화블록계획법 실험에 해당하는 프리드만 검정(Friedman test)을 소개한다.

[예 9.2.1]의 자동차 연비 측정 문제를 가지고 프리드만 검정을 살펴보자.

[예 10.3.2] [예 9.2.1]에서 세 종류의 자동차(A, B, C)의 연비를 확률화블록계획법으로 다섯 명의 운전자가 측정한 연비 데이터(표 9.2.4)를 여기서 다시 정리해 놓았다.

표 10.3.7 세 회사 자동차의 연비

자동차 A

자동차 B

자동차 C

운전자

(블록)

1

22.4

16.3

20.2

2

16.1

12.6

15.2

3

19.7

15.9

18.7

4

21.1

17.8

18.9

5

24.5

21.0

18.9

1) 세 자동차의 연비를 모수적 방법으로 검정을 할 수 있는지 데이터의 히스토그램을 그려보라.

2) 확률화블록계획법의 비모수적 방법인 프리드만 검정을 이용하여 세 자동차의 연비가 다르다고 할 수 있는지 검정을 하라. 유의수준 5%.

3)『eStatU』를 이용하여 위의 프리드만 검정 결과를 확인하라.

<풀이>

1) 『eStat』에 <그림 10.3.8>과 같이 데이터를 입력한다.

<그림 10.3.8> 『eStat』데이터 입력

 

실습

 

분산분석 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 연비, ‘by 그룹’을 자동차로 선택하면 각 자동차별 평균-신뢰구간 점그래프가 나타난다. 다시 그래프 밑의 선택사항에서 ‘히스토그램’ 버튼을 누르면 <그림 10.3.9>와 같은 각 자동차 종류별 히스토그램과 정규분포 곡선이 나타난다.

<그림 10.3.9> 회사별 만족도 점수의 히스토그램

히스토그램을 살펴보면 데이터의 수가 작아서 모집단이 정규분포를 따른다고 가정하기에는 충분치 못하다. 이러한 경우 모수적 가설검정인 $F$검정을 적용하면 오류를 범할 수 있다. 이 문제에 대한 가설은 세 모집단의 위치모수 $M_{1}$, $M_{2}$, $M_{3}$가 같은지를 검정하는 것이다.

$H_{0}\ :\ M_{1}=M_{2}=M_{3}$  $H_{1}\ :\ {\rm 적어도}\ {\rm 한쌍}\ {\rm 이상의}\ {\rm 위치모수가}\ {\rm 다름}$

프리드만 검정은 세 종류의 자동차에 대해 각각의 운전자(블록)별로 측정한 연비에 대해 순위를 계산한 후(표 10.3.8) 각 자동차별로 순위합 $R_{1},R_{2},R_{3}$를 계산한다. 이때 동점값이 있으면 평균 순위를 이용한다. 프리드만 검정통계량  $S$는 이원분산분석의  $F$검정에서 이러한 순위 데이터를 사용한 것으로 볼 수 있다.

$S={{12}\over{nk(k+1)}}\sum\limits_{j=1}^{k}{R_{j}^{2}-3n(k+1)}$, 여기서 $k=3$

표 10.3.8 각 블록별 순위 데이터

자동차 A

자동차 B

자동차 C

운전자

(블록)

1

3

1

2

2

3

1

2

3

3

1

2

4

3

1

2

5

3

1

2

위합

$R_{1}=15$

$R_{2}=5$

$R_{3}=10$

자동차 A(표본 1)의 순위합은 $R_{1}=15$, 자동차 B(표본 2)의 순위합은 $R_{2}=5$, 자동차 C(표본 3)의 순위합은 $R_{3}=10$ 이다. $R_{1}$, $R_{2}$, $R_{3}$가 차이가 나는데 세 모집단의 위치모수가 통계적으로 다른 것으로 유의할까?

위의 예에 대한 $S$검정통계량은 다음과 같다.

$S={{12}\over{15\times 3(3+1)}}\left({15^{2}+5^{2}+10^{2}}\right)-3\times 10\left({3+1}\right)=10$

귀무가설이 맞는 경우 어느 정도 큰 값이 통계적으로 유의한지 조사하기 위해서는 검정통계량 $S$의 분포를 알아야 한다. $n=5$, $k=3$일 때 순위의 경우의 수는 $(3!)^{5}=7776$이다. 이러한 가능한 순위합을 모두 조사하여 $S$분포표를 만들기는 쉽지 않다. 『eStatU』에는 <그림 10.3.10>과 같이 $n=5$, $k=3$인 경우에 프리드만 $S$분포를 보여주고 분포표(표 10.3.9)를 정리하여 준다. 그림에서 보듯이  $S$분포는 비대칭 분포이다.

<그림 10.3.10> $n=5$, $k=3$인 경우의 프리드만 분포

표 10.3.9 $n=5$, $k=3$인 경우의 프리드만 분포표

프리드만 $S$분포

$k=3$

$n=5$

$x$

$P(X=x)$

$P(X\leq x)$

$P(X\geq x)$

0.000

0.0463

0.0463

1.0000

0.400

0.2623

0.3086

0.9537

1.200

0.1698

0.4784

0.6914

1.600

0.1543

0.6327

0.5216

2.800

0.1852

0.8179

0.3673

3.600

0.0579

0.8758

0.1821

4.800

0.0309

0.9066

0.1242

5.200

0.0540

0.9606

0.0934

6.400

0.0154

0.9761

0.0394

7.600

0.0154

0.9915

0.0239

8.400

0.0077

0.9992

0.0085

10.000

0.0008

1.0000

0.0008

$S$검정은 우측검정이다. 유의수준이 5%일 때 오른쪽 5% 백분위수를 찾으면 $P(X\geq 6.4)=0.0394$이다. 이산형 분포이므로 5% 백분위수의 정확한 값은 없다. 그러므로 기각역은 다음과 같이 정할 수 있다.

‘만일 $S\geq 6.4$이면 $H_{0}$기각’

이 문제에서는 $S=10$이므로 $H_{0}$를 기각한다.

3)『eStatU』에서 데이터를 입력한 후(<그림 10.3.11>) ‘실행’ 버튼을 누르면 표본통계량이 나타나고 <그림 10.3.12>와 같은 검정결과를 보여준다. 여기서는 유의수준 5%가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

<그림 10.3.11> 『eStatU』프리드만 검정 데이터 입력
<그림 10.3.12> 『eStatU』를 이용한 프리드만 검정 결과

지금까지 예를 들어 설명한 프리드만 $S$검정을 일반화하여 보자. $k$개의 수준에 블록이 $n$개인 데이터의 순위를 다음과 같이 표시하자.

표 10.3.10 확률화블록계획법의 각 수준별 확률표본에 대한 기호

치리

블록

수준 1

수준 2

$\cdots$

수준 $k$

1

$X_{11}$

$X_{21}$

$\cdots$

$X{}_{k1}$

2

$X_{12}$

$X_{22}$

$X{}_{k2}$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$n$

$X_{1n}$

$X_{2n}$

$X{}_{kn}$

평균

${\bar X}_{1\cdot}$

${\bar X}_{2\cdot}$

$\cdots$

${\bar X}_{k\cdot}$

${\bar X}_{\cdot\cdot}$

프리드만 검정의 기본 모형은 다음과 같다.

$X_{ij}={\rm \mu}+{\rm \tau}_{i}+{\rm \beta}_{j}+\varepsilon_{ij}$, $i=1,2,\cdots ,k$; $j=1,2,\cdots ,n$(10-19)

여기서 ${\rm \tau}_{i}$는 수준 $i$의 효과를 의미하며, ${\rm \beta}_{j}$는 블록효과, $\varepsilon_{ij}$는 서로 독립이며 동일한 연속형 분포를 따른다. 단, $\sum\limits_{i=1}^{k}{\tau_{i}=0}$, $\sum\limits_{j=1}^{n}{\beta_{j}=0}$

검정의 귀무가설은 다음과 같다.

$H_{0}\ :\ {\rm \tau}_{1}={\rm \tau}_{2}=\cdots={\rm \tau}_{k}=0$ (10-20)

$H_{1}\ :\ {\rm 적어도}\ {\rm 하나의}\ {\rm \tau}_{i}{\rm 는}\ {\rm 0이}\ {\rm 아니다}$ (10-21)

프리드만 검정을 위해서는 각 블록별 순위 데이터를 만들어야 한다. 표 10.3.11은는 각 수준별 순위 데이터의 기호이다.

표 10.3.11 각 수준별 순위 데이터에 대한 기호

치리

블록

수준 1

수준 2

$\cdots$

수준 $k$

1

$R_{11}$

$R_{21}$

$\cdots$

$R_{k1}$

2

$R_{12}$

$R_{22}$

$R_{k2}$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$n$

$R_{1n}$

$R_{2n}$

$R_{kn}$

순위합

$R_{1\cdot}$

$R_{2\cdot}$

$\cdots$

$R_{k\cdot}$

평균순위

${\bar R}_{1\cdot}$

${\bar R}_{2\cdot}$

$\cdots$

${\bar R}_{k\cdot}$

총평균

${\bar R}_{\cdot\cdot}=\left({k+1}\right)/2$

표 10.3.11의 순위 데이터에 대해 9.2절에서 연구한 분산분석에서 관측값 대신에 블록별 순위를 적용해 제곱합을 계산하여 보면 총제곱합 $SST$와 블록제곱합 $SSB$는 상수가 된다. 처리제곱합은 다음과 같다.

$SSTr=\sum\limits_{i=1}^{k}{n}({\bar R}_{i\cdot}-{\bar R}_{\cdot\cdot})^{2}$(10-22)

$SST=SSTr+SSE$(10-23)

$F$검정통계량은 다음과 같이 표시할 수 있다.

$F={{MSTr}\over{MSE}}=c{{SSTr}\over{SST-SSTr-SSE}}$, 여기서 $c$는 상수 (10-24)

즉, $SST$가 상수이므로 $F$검정통계량은 $SSTr$에 비례하는 값이다.

프리드만 검정통계량 $S$는 $SSTr$에 비례하는 통계량으로 다음과 같다.

$S={{12}\over{k(k+1)}}SSTr={{12n}\over{k(k+1)}}\sum\limits_{i=1}^{k}{{\left({{\bar R}_{i\cdot}-{\bar R}_{\cdot\cdot}}\right)}^{2}}$

$=12{{12}\over{nk(k+1)}}\sum\limits_{i=1}^{k}{R_{i\cdot}^{2}}-3n(k+1)$

(10-25)

$S$통계량의 정의에서 $SSTr$에 상수 ${{12}\over{k(k+1)}}$을 곱한 것은 이 통계량의 근사분포가 자유도가 $k-1$인 카이제곱분포가 되도록 하기 위한 것이다.

프리드만 검정통계량의 분포는 $s(k,n)$으로 표시한다. 『eStatU』를 이용하면 $k=3$일 때 $n\leq 8$까지, $k=4$일 때 $n\leq 6$까지의 프리드만 분포표 $s(k,n)$를 쉽게 구할 수 있다.$s(k,n)_{{\rm \alpha}}$는 이 분포의 우측 $100\times{{\rm \alpha}}\%$ 백분위수를 의미하는데 이산형 분포여서 정확한 백분위수를 구할 수 없는 경우가 많아 대략 $s(k,n)_{{\rm \alpha}}$ 근처의 두 수의 중간값을 이용하기도 한다. 표 10.3.12는 프리드만 검정의 선택기준을 요약한 것이다.

표 10.3.12 프리드만 검정

가설

선택기준

검정통계량 $S$

$H_{0}\ :\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$

$H_{0}\ :\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$

$S>s{\left({k,\ n}\right)}_{\alpha}$이면  

$H_{0}$기각

프리드만 통계량 $S$의 분포는 모집단의 분포와 무관하다. 즉, 프리드만 검정은 분포무관 검정법이다.

귀무가설이 사실인 경우 표본이 충분히 크다면 검정통계량 $S$는 자유도가 $k-1$인 카이제곱분포에 근사한다. 표 10.3.13은 대표본의 경우 프리드만 검정의 선택기준을 요약한 것이다.

표 10.3.13 프리드만 검정 – 대표본의 경우

가설

선택기준

검정통계량 $S$

$H_{0}\ :\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$

$H_{1}\ :\ {\rm 적어도}\ {\rm 하나의}\ {\rm \tau}_{i}{\rm 는}\ {\rm 0이}\ {\rm 아니다}$

$S>\chi_{k-1\ ;\ \alpha}^{2}$이면  $H_{0}$기각

동점이 있는 경우에는 순위를 구할 때 평균 순위를 사용하여 계산한다. 이 경우 통계량 $S$는 다음과 같이 수정하여 사용한다.

$S’={{S}\over{1-\sum\limits_{j=1}^{g}{{{T_{j}}\over{np(p^{2}-1)}}}}}$

여기서 $g=\left({{\rm 동점}\ {\rm 그룹의}\ {\rm 수}}\right)$

$T_{j}=\sum\limits_{j=1}^{g}{t_{j}\left({t_{j}-1}\right)\left({t_{j}+1}\right)}$

$t_{j}=\left({j{\rm 번째}\ {\rm 동점}\ {\rm 그룹의}\ {\rm 크기,}\ {\rm 즉,}\ {\rm 동점}\ {\rm 그룹에}\ {\rm 포함된}\ {\rm 관측값의}\ {\rm 개수}}\right)$

위 식에서 동점이 아닌 관측값은 크기 1인 동점 그룹으로 취급되어 $t_{j}=1$이 된다.

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다