7. 한 모집단 모수의 가설검정

7.1 모평균 가설검정

한 모집단 모수의 가설검정에 대한 예는 다음과 같다.

1) 어느 과자제품의 겉봉지에 용량이 200g이라 표시되어 있다. 과연 표시된 용량만큼 과자가 들어있을까?
2) 어느 전구공장에서 새로 개발한 전구가 과거의 것보다 훨씬 전구 수명이 길다고 선전한다. 과연 이 선전이 믿을만 할까?
3) 금년도 대입 학력고사를 치르고 난 직후 학생들은 영어 성적 평균이 5점정도 작년보다 증가될 것이라고 한다. 이것이 사실인지 어떻게 조사할 수 있나?

위와 같은 의문(가설)에 대한 답을 주는 것이 가설검정(hypothesis testing)이다. 즉, 가설검정은 표본을 이용하여 미지의 모집단 모수에 대한 두 가지 가설을 놓고 어느 가설을 선택할 것인지 통계적으로 의사결정을 하는 것이다. 이 장에서는 가설검정에서 가장 많이 이용되는 모평균, 모분산 및 모비율의 검정에 대하여 알아보자.
다음은 한 모집단에서 모평균의 가설검정에 대한 이론을 예를 이용하여 설명한 것이다.

[예 7.1.1] 어느 전구 공장에서 기존의 생산방식으로 만들어진 전구의 평균수명은 1500시간, 표준편차는 200시간으로 알려져 있다. 최근 이 회사에서 새로운 생산방식을 도입하려는데, 이 방식으로 생산된 전구는 평균수명이 1600시간이라고 한다. 이와 같은 주장을 확인하기 위해 30개의 표본을 단순임의 추출하여 표본평균을 구하여 보니 $\bar{x}$ = 1555 이었다. 과연 새 방식의 전구수명이 1600시간이라고 할 수 있는가?

<풀이>

이 문제의 질문에 대한 답을 통계적으로 접근하는 방법은 먼저 모평균($\mu$)에 대한 서로 다른 주장에 대해 두개의 가설을 세운다. 즉,

$H_{0}$: $\mu$ = 1500 $H_{1}$: $\mu$ = 1600

여기서 $H_{0}$를 귀무가설(null hypothesis), $H_{1}$을 대립가설(alternative hypothesis)이라 부른다. 대개의 경우에 귀무가설 $H_{0}$는 기존의 알려져 있는 사실로 정하고, 대립가설은 새로운 사실 또는 현재의 믿음에 변화가 있는 사실을 정한다. 그래서 두 가설 중 하나를 선택할 때, ‘확실한 근거가 있기 전에는 대립가설(변화된 사실)을 선택하지 않고 귀무가설(현재의 사실)을 받아들인다’는 것이 가설검정의 기본적인 생각이다. 이러한 가설검정을 보수적 의사결정방법 (conservative decision making)이라고 한다.
두 개의 가설 중 하나를 선택하는 상식적인 기준은 ‘표본평균이 어느 가설에 더 가까운가’일 것이다. 이러한 거리개념을 이용하는 상식적 기준에 의하면 표본평균 1555이 $H_{1}$: $\mu$ = 1600에 더 가까우므로 대립가설을 선택할 것이다. 통계적 가설검정도 상식적 기준에 근거한 것인데 다만 $\bar{X}$의 표본분포 이론도 함께 고려한 것이다. 즉, 통계적 가설검정은 $\bar{X}$의 표집분포 이론에 근거한 기준값(critical value) $C$ 를 선정한 후 (다음 쪽에 설명이 나옴)
‘$\bar{X}$가 $C$보다 작으면 가설 $H_{0}$를 채택, 아니면 $H_{0}$를 기각($H_{1}$ 채택)’ 이라는 선택기준(decision rule)으로 한 가설을 선택하게 된다. 이때 $\bar{X}$가 $C$ 보다 작은 영역 {$\bar{X}$ < $C$}를 $H_{0}$ 채택역(acceptance region), $\bar{X}$가 $C$ 보다 큰 영역 {$\bar{X}$ ≥ $C$}를 $H_{0}$ 기각역(rejection region)이라 부른다(<그림 7.1.1>).

[그림 7.1.1] 채택역과 기각역
이러한 선택방법에 의해 한 가설을 선택하게 되면 반드시 그 결정에는 두 가지 오류의 가능성이 있다. 즉, $H_{0}$가 참일 때 $H_{1}$ 을 채택하는 1종오류(Type I Error)와 $H_{1}$이 참일 때 $H_{0}$를 채택하는 2종오류(Type II Error)가 있다. 이들을 표로 요약하면 다음과 같다.

표 7.1.1 가설검정의 오류

실제 상황

$H_{0}$ 참

$H_{1}$ 참

검정결과:

$H_{0}$ 채택

옳은 결정

2종오류

$H_{1}$ 채택

1종오류

옳은 결정

이 두 가지 오류는 표본의 크기가 일정할 때 어느 한 오류를 줄이려고 하면 다른 오류가 커지게 된다. 그래서 귀무가설 $H_{0}$를 ‘과거나 현재의 사실’로 하고 ‘확실한 근거가 없는 한 귀무가설을 채택’하는 보수적 결정방식을 생각해 낸 것이다. 이러한 보수적 방식에서는 ‘귀무가설이 참인데 대립가설을 선택’하는 1종오류가 우리에게 더 큰 손실을 가져오므로 이를 가능하면 줄이려고 노력한다. 즉, 통계적 가설검정에서는 1종오류가 발생할 확률의 허용한계(대개 5%이나, 엄격한 검정에서는 1%를 사용)를 결정하여, 이 한계를 만족시키는 선택기준을 이용한다. 이 1종오류가 발생할 확률의 허용한계를 유의수준(significance level)이라 하며 흔히 $\alpha$로 나타낸다. 2종오류의 확률은 대개 $\beta$로 표시한다.
유의수준만 정하면 5장의 표본평균의 표집분포를 이용하여 두 가설에 대한 선택기준을 마련할 수 있다. <그림 7.1.2>는 두 개의 가설에 대한 가상적인 모집단의 분포와, 각 모집단에 대한 모든 가능한 표본평균의 표집분포를 그린 것이다.

[그림 7.1.2] 통계적 가설검정
표본평균의 표집분포는 중심극한정리에 의해 근사적으로 $H_{0}$ : $\mu$ = 1500 의 모집단인 경우 $N(1500,\frac{200^2}{30})$이고, $H_{1}$ : $\mu$ = 1600 의 모집단인 경우 $N(1600,\frac{200^2}{30})$이 된다. 여기서 각 모집단의 표준편차는 과거의 자료인 200으로 가정하였다. 이때

‘$\bar{X}$가 $C$보다 적으면 $\mathrm{H_{0}}$를 채택하고, $\bar{X}$가 $C$보다 크면 $H_{1}$ 을 채택’

하는 선택기준을 세우면 그림의 빗금 친 부분이 1종오류가 발생할 확률을 나타낸다. 만일에 유의수준, 즉, 1종오류 발생확률의 허용한계를 5%로 하면 (즉, $P$($\bar{X}$ < $C$) = 0.95) $C$는 정규분포이론에 의해

$1500+1.645\frac{200}{}\sqrt{30}$ = $1560.06$

가 된다. 따라서 선택기준은 다음과 같다.

‘${\bar{X}}<1500+1.645\frac{200}{\sqrt{30}}=1560.06$ 이면 $H_{0}$를 채택하고, 아니면 $H_{0}$를 기각($H_{1}$ 채택).’

이 문제에서는 확률변량 $\bar{X}$의 관찰된 표본평균 ${\bar{x}}$ = 1555 이므로 $H_{0}$를 채택한다. 즉, $H_{0}$ : $\mu$ = 1500 인 가설이 맞다고 판정하는 것인데 이는 상식적 기준에 의한 결과와 상반되는 것이다. 그 이유는 보수적 의사결정 방식이기 때문에 표본의 결과가 귀무가설을 기각할 충분한 근거가 되지 못한다는 것이다.
위의 선택기준은 보수적 결정방식에 의한 결과라는 것을 강조하는 의미로 다음과 같이 쓰기도 한다.

‘$\bar{X}$ < 1560.06 이면 $H_{0}$를 기각하지 못하고, 아니면 $H_{0}$를 기각.’

또 위의 선택기준은 계산편의상 아래와 같이 쓰기도 한다.

‘$\frac{\bar{X}{-}{1500}}{\frac{200}{\sqrt{30}}}<1.645$ 이면 $H_{0}$를 채택, 아니면 $H_{0}$ 기각.’
이 경우 ${\bar{x}}$ = 1555 일 때 $\frac{1555-1500}{\frac{200}{\sqrt{30}}}=1.506$ 은 1.645보다 작으므로 $H_{0}$를 채택한다.

[예 7.1.1 풀이끝]

 

[예 7.1.1]에서 보았듯이 보수적 결정방식에 의한 가설검정에서는 1종오류가 발생할 확률에 근거한 선택기준을 만들었기 때문에, 대립가설 $H_{1}$ : $\mu$ = 1600 은 선택기준에 단지 ‘가설 $H_{0}$ 의 모평균($\mu$= 1500)보다 크다’라는 점만 고려되었다. 즉, [예 7.1.1]에서 대립가설을 $H_{1}$ : $\mu$ > 1500 이라 하여도 똑같은 계산에 의해 $H_{0}$를 기각한다는 결론을 내릴 수 있다.
일반적으로 모평균에 대한 가설검정에서 대립가설의 형태는 크게 다음 세 가지이다.

1) $H_{1}$ : $\mu$ > $\mu_{0}$ 2) $H_{1}$ : $\mu$ < $\mu_{0}$ 3) $H_{1}$ : $\mu$ ≠$\mu_{0}$

1)은 가설 $H_{0}$ 오른쪽에 기각역을 가지므로 우측검정(right-sided test), 2)는 가설 $H_{0}$ 왼쪽에 기각역을 가지므로 좌측검정(left-sided test), 3)은 가설 $H_{0}$ 양편에 기각역을 가지므로 양측검정(two-sided test)이라 부른다. 모표준편차를 알 경우(현실적이지는 못하지만 이론을 전개시키기 위한 것임) 각각의 형태에 대한 가설의 선택기준은 표 7.1.2와 같다. 여기서 $\alpha$는 유의수준이다.

표 7.1.2 모평균의 가설검정 – 모표준편차 $\sigma$를 모르는 경우 (모집단이 정규분포)

가설의 종류

선택 기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{>}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}{>}{z}_{\mathit{\alpha}}$ 이면 $H_{0}$ 기각

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{<}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}{<}{-}{z}_{\mathit{\alpha}}$ 이면 $H_{0}$ 기각

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{\ne}{\mathit{\mu}}_{0}$

$\left|{\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}}\right|{>}{z}_{\mathit{\alpha}{/}{2}}$ 이면 $H_{0}$ 기각

참고: 1)의 경우 $H_{0}:\mu{\leq}\mu_{0}$ 로, 2)의 경우 $H_{0}:\mu{\geq}\mu_{0}$로 쓸 수 있다.

선택기준에 사용되는 다음 식

${\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}}$

를 검정통계량(test statistic)이라고 부른다. 일반적으로 모표준편차 $\sigma$ 는 미지수이다. 그러나 표본의 크기가 충분히 클 경우(대략 30이상) 위의 가설검정 공식에서 $\sigma$ 대신 표본표준편차 $S$를 이용하여 모평균의 가설검정을 할 수 있다.
[예 7.1.1]에서 ${\bar{X}}$가 1555 일 경우나 1540 일 경우 모두 가설 $H_{0}$ 는 기각되지 못하지만 기각되지 못한 근거의 정도가 다르다. 가설이 기각되지 못한 근거의 정도는 관찰된 표본평균의 값을 기준값으로 하였을 때의 1종오류 확률을 계산하면 알 수 있는데 이를 $p$-값($p$-value)이라 한다. 즉, $p$-값은 측정된 표본평균이 모든 가능한 표본평균 중에서 어디에 위치하고 있는지를 알려 준다. ${\bar{X}}$가 1540일 경우의 $p$-값은, ${\bar{X}}$가 1555일 경우의 $p$-값보다 크다. $p$-값은 더 클수록 기각되지 못한 강력한 근거가 된다(귀무가설 $H_{0}$가 기각되는 경우는 더 작을수록 기각된 근거가 더 강력하다). 따라서 $p$-값이 분석자가 고려하는 유의수준보다 작으면 표본평균이 기각역에 있다는 것을 뜻하기 때문에 $H_{0}$를 기각한다. 대부분의 통계패키지에서는 $p$-값을 계산하여 준다.

☞ ${$p-}$값을 이용한 가설 선택기준
${$p-}$값이 유의수준보다 작으면 $H_{0}$기각, 아니면 $H_{0}$ 채택

구체적으로 각각의 검정형태에 따른 $p$-값의 계산은 아래와 같다.

표 7.1.3 $p-$값의 계산

가설의 종류

선택 기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{>}{\mathit{\mu}}_{0}$

${P}\left({\bar{X}{>}{\bar{x}}_{obs}}\right)$

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{<}{\mathit{\mu}}_{0}$

${P}\left({\bar{X}{<}{\bar{x}}_{obs}}\right)$

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{\ne}{\mathit{\mu}}_{0}$

${\bar{X}}_{obs}{>}{\mathit{\mu}}_{0}$ 이면 $2{P}\left({\bar{X}{>}{\bar{x}}_{obs}}\right)$, 아니면 $2{P}\left({\bar{X}{<}{\bar{x}}_{obs}}\right)$

참고: ${\bar{x}}_{obs}$는 관찰된 표본평균의 값을 뜻한다.

모표준편차 $\sigma$를 모르는 경우 모집단이 정규분포를 따른다면 검정통계량

$({\bar{X}}\textit{-}\mu_{0})/(\frac{S}{\sqrt{n}})$

는 자유도가 (n-1)인 $t$분포를 따르므로 모평균 가설검정은 표 7.1.2의 선택기준에서 표준정규분포 대신 $t$분포를 사용하여 다음과 같다.

표 7.1.4 모평균의 가설검정 – 모표준편차 를 모르는 경우 (모집단이 정규분포)

가설의 종류

선택 기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{>}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{S}{\sqrt{n}}}{>}{t}_{{n}{-}{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\alpha}}$ 이면 $H_{0}$ 기각

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{<}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{S}{\sqrt{n}}}{<}{-}{t}_{{n}{-}{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\alpha}}$ 이면 $H_{0}$ 기각

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{\ne}{\mathit{\mu}}_{0}$

$\left|{\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{S}{\sqrt{n}}}}\right|{>}{t}_{{n}{-}{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\alpha}{/}{2}}$ 이면 $H_{0}$ 기각

참고: 1)의 경우 $H_{0}:\mu{leq}\mu_{0}$ 로, 2)의 경우 $H_{0}:\mu{geq}\mu_{0}$로 쓸 수 있다.

표본의 크기가 충분히 클 경우(대략 30이상) $t$분포는 정규분포에 근사하므로 표 7.1.2의 가설검정 공식에서 $\sigma$ 대신 표본표준편차 $S$ 를 이용하여 모평균의 가설검정을 할 수 있다.

[예 7.1.2] 어느 과자 봉지에 적혀있는 무게가 250g이다. 과자의 무게는 정규분포라 가정하자. 과자 표본 100개를 조사하였더니 평균이 253g, 표준편차가 10g이었다.

1) 과자의 무게가 250g인지, 아니면 이보다 큰지 검정하고 $p$-값을 구하라. $\alpha$ = 1%
2) 과자의 무게가 250g인지, 아닌지 검정하고 $p$-값을 구하라. $\alpha$ = 1%
3)『eStatU』을 이용하여 위의 가설검정을 하라.

<풀이>

1) 이 문제의 가설은 $H_{0}$: $\mu$ = 250, $H_{1}$: $\mu$ > 250 인 우측검정이다. 표본의 크기가 크므로 ($n$=100) $t$분포 대신에 표준정규분포를 사용하여도 무방하다. 선택기준은 다음과 같다.

‘${({\bar{X}}-\mu_{0}})/({\frac{S}{\sqrt{n}})>z}_\alpha$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘$(253-250)/(\frac{10}{\sqrt{100}})>z_{0.01}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 (253-250) / (10/10) = 3, $z_{0.01}$ = 2.326 이므로 $H_{0}$ 는 기각이 된다. 가설의 선택기준을 아래와 같이 쓸 수도 있다.

‘${\bar{X}}>250+2.326({\frac{10}{\sqrt{100}}})$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘${\bar{X}}>252.326$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

$p$-값은 표본평균을 기준값으로 했을 때의 1종오류의 확률이므로 표본평균이 253보다 클 확률을 구하면 된다. $H_{0}$: $\mu$ = 250 이 참이라는 가정 하에서 $\bar{X}$의 분포는 근사적으로 $N(250,100over100)$인 분포이므로

$p$-값 = $\mathrm{P}$(${\bar{X}}$ > 253) = $\mathrm{P}$($Z$ > (253-250)/(10/10)) = $\mathrm{P}$($Z$ > 3) = 0.0013

이다. 여기서 (253-250)/(10/10) = 3 는 위에서 이미 계산했던 검정통계량의 값임을 주목하면, $p$-값은 바로 검정통계량의 분포(여기서는 표준정규분포)를 이용하여 구할 수 있다.
2) 이 예의 가설은 $H_{0}$: $\mu$ = 250, $H_{1}$: $\mu$ ≠ 250 인 양측검정이다. 표본의 크기가 크므로 ($n$ = 100) 가설 선택기준은 다음과 같다.

‘${\left|\frac{{{\bar{X}}-\mu_{0}}}{\frac{S}{\sqrt{n}}}\right|>z_{}alpha/2}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘${\left|\frac{{{253}-250}}{\frac{10}{\sqrt{100}}}\right|>z}_{0.005}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 (253-250) / (10/10) = 3, $z_{0.005}$ = 2.575 이므로 $H_{0}$ 는 기각이 된다. $p$-값은 표본평균을 기준값으로 했을 때의 1종오류의 확률이므로 표본평균이 53보다 클 확률을 구하여 2를 곱하면 된다. $H_{0}$: $\mu$ = 50 이 참이라는 가정 하에서 $\bar{X}$의 분포는 근사적으로 N(250, 100/100)인 분포이므로 $p$-값은 다음과 같다.

$p$-값 = 2$P$($\bar{X}$ > 53) = 2$P$($Z$ > (53-50)/(10/10)) = 2P($Z$ > 3) = 0.0026

3) 『eStatU』에서 ‘추정 및 가설검정 : 모평균 $\mu$’를 선택하여 나타나는 <그림 7.1.3>과 같은 창에서 대립가설을 우측검정으로 선택하고, [검정형태]를 ‘$Z$ 검정’을 체크한다. 그리고 유의수준을 5%로 체크하고, 표본크기 100, 표본평균 253, 표본분산은 $10^2=100$을 입력한다. $Z$ 검정의 경우 모분산을 입력하여야 하나 표본의 크기가 충분히 크므로 표본분산을 입력해도 좋다.

『eStatU』가설검정 결과는 <그림 7.1.4>와 같다.

[그림 7.1.4] 『eStatU』를 이용한 $Z$우측 검정 결과
<그림 7.1.3>에서 대립가설을 양측검정을 선택하고 실행하면 <그림 7.1.5>와 같은 결과가 나타난다.

[그림 7.1.5] 『eStatU』를 이용한 양측 검정 결과
실습

 

[예 7.1.2 풀이끝]

 

[예 7.1.3] [예 7.1.2]의 1) 문제에서 표본의 크기가 16개일 때 과자의 무게가 250g인지 아니면 이보다 큰지 검정하고 $p$-값을 구하라. 『eStatU』를 이용하여 결과를 확인하라.

<풀이>

모표준편차를 모르고 소표본이므로 가설 선택기준은 다음과 같다.

‘$({\bar{X}}\textit{-}\mu_{o})/(\frac{S}{\sqrt{n}})>t_{n-1;\alpha{}}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘${(}{253}{-}{250}{)/(}\frac{10}{\sqrt{16}}{)}{>}{t}_{{16}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}{0}{.}{01}}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 ${(253-250})/({\frac{10}{\sqrt{16}}})=1.2,t_{15,0.01}=2.602$ 이므로 $H_{0}$가 채택이 된다.
가설 선택기준을 다음과 같이 적을 수도 있음을 유의하라.

‘${{\bar{X}}>250}+2.602({\frac{10}{\sqrt{16}}})$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

<그림 7.1.3>에서 대립가설을 우측검정, [검정형태]로 $t$ 검정을 선택하고 표본의 크기 $n$ = 16으로 하여 실행하면 <그림 7.1.6>과 같은 결과가 나타난다.

<그림 7.1.6> 『eStatU』를 이용한 $t$분포 우측검정 결과

$p$-값은 $t_{15}$분포에서 검정통계량의 값 1.2 보다 클 확률이므로 『eStatU』프로그램을 이용하면 0.124임을 알 수 있다.

[예 7.1.3 풀이끝]

 

[예 7.1.4] (『eStat』실습)
남자 대학생 10명을 표본 추출하여 신장을 조사하니 다음과 같다. (단위 cm)

172 175 178 182 176 180 169 185 173 177

모평균이 175cm 인지 아니면 이보다 큰지 유의수준 5%로 가설검정하라.

<풀이>

『eStat』에서 시트에 <그림 7.1.7>과 같이 데이터를 입력한 후 모평균 가설검정 아이콘 를 클릭하고 변량선택박스‘에서 ’분석변량‘을 V1 선택하면 데이터의 평균-신뢰구간 점그래프가 나타난다(<그림 7.1.8>).

[그림 7.1.8] 『eStat』을 이용한 점그래프 및 평균 신뢰구간
[그림 7.1.7] 『eStat』 데이터 입력
[그림 7.1.10] 데이터의 히스토그램과 정규분포 곡선
그래프 창 밑의 선택 창(<그림 7.1.9>)에서 ‘히스토그램’을 클릭하면 <그림 7.1.10>과 같이 데이터에 대한 히스토그램과 정규분포곡선이 출력되어 데이터가 정규분포인지 대략 검사할 수 있다. ‘정규 Q-Q산점도’, ‘정규적합성검정’은 11장에서 설명한다.

[그림 7.1.9] 모평균 가설검정의 선택사항
[그림 7.1.11] 모평균 가설검정의 그래프
선택 창에서 <그림 7.1.9>과 같이 $\mu_{0}$ = 170을 입력하고, 대립가설 형태를 우측검정, 유의수준을 5%로 선택하고 ‘$t$ 검정(Z)’ 버튼을 누르면 <그림 7.1.11>과 같은 가설검정 그래프가 나타나고 로그창에 검정결과가 나타난다(<그림 7.1.12>).

[그림 7.1.12] 모평균 가설검정의 결과
선택 창에서 Z 검정을 선택할 수도 있다. 이 경우에는 모표준편차 $\sigma$를 입력하여야 한다.

[예 7.1.4 풀이끝]

 

표본분산을 이용한 모평균의 가설검정은 모집단이 정규분포를 한다는 가정이 필요하다. 표본 데이터를 이용하여 모집단이 정규분포인지 검정하는 것을 적합성검정이라 한다. 『eStat』의 모평균 가설검정 선택사항에서 ‘히스토그램’을 선택하면 <그림 7.1.9>와 같은 데이터의 히스토그램과 정규분포 그래프를 같이 그려져 대략적인 정규성 검정을 할 수 있다. 자세한 내용은 11장에서 살펴본다.
이 절에서는 표본의 크기가 이미 주어진 경우에 어떻게 가설검정하는지 알아보았다. 표본의 크기가 일정할 경우에 1종오류의 가능성을 줄이려고 하면 2종오류의 가능성이 커지므로 두 종류의 오류를 동시에 줄일 수는 없다. 따라서, 표본의 크기가 미리 정해졌거나, 자료가 주어진 경우에는 보수적 결정방법으로 1종오류만을 고려하는 가설검정을 하였다. 그러나 만일 표본의 크기를 조절할 수 있다면 두 종류의 오류를 함께 고려하는 가설검정 방법도 있다. 자세한 내용은 7.4절에서 살펴본다.

 

7.2 모분산 가설검정

모집단의 분산을 가설검정하기 위한 예는 다음과 같다.

1) 한 자동차회사에 현재 볼트를 납품하는 부품회사의 볼트는 직경이 평균 7mm, 분산이 0.25라고 한다. 최근 경쟁회사는 자기회사의 볼트는 직경의 평균이 7mm, 분산이 0.16이라고 주장하면서 납품을 신청하고 있다. 과연 이 주장이 맞는지 어떻게 알아볼 수 있는가?
2) 작년도 대입 학력고사 수학점수의 분산이 100 이라 한다. 금년도 수학 문제가 작년보다 너무 쉽다고 한다. 학력고사 성적의 분산이 작년보다 작아졌는지 어떻게 알아 볼 수 있나?

모평균에 대한 가설검정을 이해하면 모분산의 가설검정은 표본분포와 검정통계량만 다르고 기본적인 개념은 같다. 5장에서 표본분산($S^2$)의 분포는 모집단의 분산이 $\sigma^2$인 정규분포를 따를 때 표본의 크기가 $n$이라면 $(n-1)S^2/sigma^2$은 자유도가 ($n-1$)인 카이제곱분포를 하는 것을 알았다. 이 이론을 이용하면 모분산에 대한 가설검정을 다음과 같이 할 수 있다.

표 7.2.1 모분산의 가설검정 – 모집단이 정규분포인 경우

가설의 종류

선택기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{=}\sigma^2_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{>}\sigma^2_{0}$

$\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{>}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\mathit{\alpha}}^{2}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{=}\sigma^2_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{<}\sigma^2_{0}$

$\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{<}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\mathit{\alpha}}^{2}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{=}\sigma^2_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2\ne\sigma^2_{0}$

$\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{>}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\mathit{\alpha}{/}{2}}^{2}$ 또는 $\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{<}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}{1}{-}\mathit{\alpha}{/}{2}}^{2}$ 이면 $H_{0}$기각, 아니면 $H_{0}$채택

참고: 1)에서 $H_{0}:\sigma^2\leq\sigma_{o}^2$으로, 2)에서 $H_{0}:\sigma^2\geq\sigma_{o}^2$로 쓸 수 있다.

[예 7.2.1] 자동차 부속품 중 볼트를 생산하는 회사가 있다. 이 볼트 직경의 규격은 15mm인데 분산이 ${0.10}^2$ 이내라면 납품할 수 있다. 최근에 생산된 제품 중 25개를 단순임의 표본추출하여 분산을 조사하였더니 $0.15^2$이었다. 볼트의 직경이 정규분포를 따른다고 가정하였을 때,

1) 최근 생산된 제품을 납품할 수 있는지 5% 유의수준으로 가설 검정을 하여라.
2) 『eStatU』를 이용하여 결과를 확인하라.

<풀이>

1) 이 문제의 가설은 $H_{0} : \sigma^2\leq0.1^{2}$ $H_{1} : \sigma^2 > 0.1^{2}$이다. 따라서 선택기준은

$\frac{{(}{n}{-}{1}{)}{S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{>}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\alpha}^{2}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택

이다. $s^{2}$ = $0.15^{2}=0.0225$ 이므로 (25-1)×$0.15^{2}$/$0.1^{2}$ = 54이고, $\chi_{25-1;0.05}^{2}$ = $\chi_{24;0.05}^{2}$= 36.42 이다. 따라서 가설 $H_{0}$가 기각된다.
2)『eStatU』에서 ‘추정 및 가설검정 : 모분산 $\sigma^2$’를 선택하여 나타나는 <그림 7.2.1>과 같은 창에서 모분산 $\sigma_{0}^2$ = $0.1^2=0.01$ 를 입력하고, 대립가설을 우측검정으로 선택, 유의수준을 5%, 표본크기 $n$ = 25, 표본분산 $s^2=0.15^{2}=0.0225$를 입력한다.

[그림 7.2.1] 『eStatU』의 모분산 가설검정
‘실행’ 버튼을 누르면 $\sigma^2$의 신뢰구간이 계산되고 『eStatU』가설검정 결과는 <그림 7.2.2>와 같다.

[그림 7.2.2] 『eStatU』를 이용한 모분산 우측 가설검정 결과

[예 7.2.1 풀이끝]

 

[예 7.2.2] (『eStat』실습)
[예 7.1.4]의 남자 대학생 10명에 대한 신장 데이터 (172 175 178 182 176 180 169 185 173 177)에서 모분산이 $5^2$인지 아니면 이보다 큰지 유의수준 5%로 가설검정하라.

<풀이>

『eStat』에서 시트에 <그림 7.2.3>과 같이 데이터를 입력한 후 모분산 가설검정 아이콘 를 클릭하고 ‘변량선택박스’에서 V1을 선택하면 <그림 7.2.4>와 같은 데이터의 점그래프와 (평균) $+-$ (표준편차) 구간이 나타난다.

[그림 7.2.3] 『eStat』데이터 입력
[그림 7.2.4] 모분산의 가설검정에서 점그래프와 (평균) (표준편차) 구간
그래프 창 밑의 선택창(<그림 7.2.5>)에서 $\sigma_{0}^2$ = 25를 입력하고, 대립가설 형태를 우측검정, 유의수준을 5%로 선택하고 ‘$chi^2$ 검정’ 버튼을 누르면 <그림 7.2.6>와 같은 가설검정 결과 그래프와 결과표(<그림 7.2.7>)가 나타난다.

[그림 7.2.5] 모분산 가설검정의 선택사항
[그림 7.2.6] 모분산 가설검정 결과
[그림 7.2.7] 모분산 가설검정 결과표
실습

 

[예 7.2.2 풀이끝]

 

모분산의 가설검정도 모집단이 정규분포를 한다는 가정이 필요하다. 표본 데이터를 이용하여 모집단이 정규분포인지 검정하는 것을 적합성검정이라 한다. <그림 7.2.4>의 모분산 가설검정 선택사항에서 ‘히스토그램’을 선택하면 히스토그램과 정규분포 함수를 같이 그려 대략적인 정규성 검정을 할 수 있다. 이밖에 ‘정규 적합성검정’과 ‘정규 Q-Q 산점도’를 이용할 수 있는데 자세한 내용은 11장에서 살펴본다.

 

7.3 모비율 가설검정

모집단의 미지의 비율에 대한 가설검정이 필요한 몇 가지 예를 들어보자.

1) 금년도 대통령 선거에서 특정 후보의 지지율이 과연 50%를 넘을까?
2) 작년도 실업률이 7%이었다고 한다. 올해의 실업률은 높아졌는가?
3) 자동차 부속품 1만개를 배로 수입하는데 과거의 경험으로 보아 이중 2%가 불량품이었다. 이번에도 불량품이 2%일까?

표본의 크기가 충분히 클 때 표본비율($hatp$)의 표집분포는 평균이 모비율($p$)이고 분산이 $p(1-p)/n$ 인 정규분포에 근사하게 된다. 따라서 대표본일 때의 모평균 가설검정과 유사하게 모비율의 가설검정을 다음과 같이 할 수 있다.

표 7.3.1 모비율의 가설검정 – 대표본일 경우

가설의 종류

선택기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}{p}{=}{p}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}{p}{>}{p}_{0}$

$\frac{\hat{p}{-}{p}_{0}}{\sqrt{{p}_{0}\left({{1}{-}{p}_{0}}\right){/}{n}}}{>}{z}_{\mathit{\alpha}}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}{p}{=}{p}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}{p}{<}{p}_{0}$

$\frac{\hat{p}{-}{p}_{0}}{\sqrt{{p}_{0}\left({{1}{-}{p}_{0}}\right){/}{n}}}{<}{-}{z}_{\mathit{\alpha}}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}{p}{=}{p}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}{p}\ne{p}_{0}$

$\left|{\frac{\hat{p}{-}{p}_{0}}{\sqrt{{p}_{0}\left({{1}{-}{p}_{0}}\right){/}{n}}}}\right|{>}{z}_{\mathit{\alpha}{/}{2}}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

참고: 구간추정에서와 마찬가지로 대표본의 판정기준은 $np_{0}$ > 5, $n(1-p_{0})$ > 5 임.
1)에서 $H_{0}:p\leqp_{0}$ 로, 2)의 경우 $H_{0}:p\geqp_{0}$ 로 쓸 수 있다.

소표본인 경우는 이항분포를 사용하여 가설검정을 하는데 10장의 부호검정에서 설명한다.

[예 7.3.1] 한 지역의 국회의원 선거여론조사를 지난달 실시한 결과 특정후보의 지지율이 60%이었다. 최근에 지지율에 변동이 있는지 알아보기 위해 100명을 단순임의추출하였더니 55명이 지지를 하였다.

1) 특정후보에 대한 현재 지지율이 60%에서 변동이 있는지 유의수준 5%로 검정하라.
2) 『eStatU』를 이용하여 결과를 확인하라.

<풀이>

1) 이 문제의 가설은 $H_{0}:p=0.6$, $H_{1}:p\neq{0.6}$ 이다. $np_{0}$ = 60, $n(1-p_{0})$ = 40 이므로 대표본이라 할 수 있고, 따라서 선택기준은 다음과 같다.

‘$\left|\frac{{\hat{p}}-p_{0}}{\sqrt{p_{0}(1-p_{0})/n}}\right|$> $z_{\alpha{/2}}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

$hatp$ = 55/100 = 0.55 이므로

$left|\frac{0.55-0.6}{SQRT{0.6(1-0.6)/100}}right|=left|-1.005right|=1.005$, $z_{0.05/2}$ = $z_{0.025}$ = 1.96

따라서 가설 $H_{0}$를 채택한다.
2) 『eStatU』에서 ‘추정 및 가설검정 : 모비율 $p$’를 선택하여 나타나는 <그림 7.3.1>과 같은 창에서 모비율 $p_{0}=0.6$ 을 입력하고, 대립가설을 양측검정으로 선택, 유의수준을 5%, 표본크기 $n$ = 100, 표본비율 $\hat{p}=0.55$를 입력한다. ‘실행’ 버튼을 누르면 신뢰구간이 계산되고 가설검정 결과는 <그림 7.3.2>와 같다.

[그림 7.3.1] 『eStatU』의 모비율 가설검정 데이터 입력
[그림 7.3.2] 『eStatU』를 이용한 모비율 가설검정 결과

[예 7.3.1 풀이끝]

 

7.4 α와 β를 같이 고려하는 가설검정

지금까지 알아본 가설검정은 보수적 의사결정 방식이므로 귀무가설을 충분한 반대근거가 없는 한 지키려는 사실, 대립가설을 새로운 사실로 하여 1종오류(귀무가설이 참인데도 기각하는 오류)의 확률($\alpha$)을 작게 하는 선택기준을 만들었다. 따라서 2종오류의 확률($\beta$)은 선택기준에 전혀 고려되지 않았다. 하지만 때때로 어느 사실을 귀무가설로 하고, 어느 것을 대립가설로 정해야 하는지가 애매한 경우가 있으며, 문제에 따라서 두 종류의 오류가 모두 현실적으로 중요하여 동시에 고려해야 할 때가 있다. 이 때 만일 표본의 크기를 분석자가 정할 수 있다면 $\alpha$와 $\beta$를 같이 고려하는 가설검정을 할 수 있다.

 

7.4.1 β와 검정력

2종오류의 확률을 구하는 방법을 아래의 예를 통해 알아보자.

[예 7.4.1] [예 7.1.1]의 가설검정에서 2종오류의 확률을 구하라. 유의수준은 5%이다. 이 결과를 『eStatU』를 이용하여 확인하라.

<풀이>

[예 7.1.1]에서 두 가설은 $H_{0}:\mu{=}1500$, $H_{1}:\mu{=}1600$ 이고, 모표준편차는 $\sigma$ = 200, 표본의 크기는 $n$=30 이다. 따라서 가설의 선택기준은 유의수준이 5%이므로 다음과 같다.

‘$\bar{X}$ < 1500 + (1.645)$\frac{200}{}\sqrt{30}$ = 1560.06 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

따라서 ‘$H_{1}$ 이 참인데 $H_{0}$ 가 맞다’라고 하는 2종오류의 확률은 다음과 같다.

$\beta$ = $\mathrm{P}$($\bar{X}$ < 1560.06 ∣ $H_{1}$ 이 참일 때)
= $\mathrm{P}$(($\bar{X}$-1600)/(200/$sqrt30$) < (1560.06-1600)/(200/$sqrt30$) )
= $\mathrm{P}$($Z$ < -1.09) = 0.137

『eStatU』에서 ‘모평균 가설검정 : $\alpha,\beta$’를 선택하여 나타나는 <그림 7.4.1>과 같은 창에서 [$\alpha$ 가설검정 모평균]을 선택하고 $\mu_{0}=1500$, $\mu_{1}=1600$, $\sigma{=}200$, $\alpha{=}0.05$, $n=30$을 입력한다.

[그림 7.4.1] 『eStatU』의 가설검정 모평균]
실행 버튼을 클릭하면 <그림 7.4.2>와 같은 『eStatU』가설검정 결과가 나타나고 기준선 $C$와 2종오류 확률 $\beta$가 표시된다.

[그림 7.4.2] 『eStatU』를 이용한 와 검정력의 계산 결과

[예 7.1.1 풀이끝]

 

[예 7.4.2] [예 7.1.1]의 가설검정에서 귀무가설은 변하지 않고, 대립가설이 아래와 같이 바뀌었다. 유의수준은 5%이다.

$H_{0}:\mu{=}1500$, $H_{1}:\mu{=}1580$

1) 2종오류의 확률을 구하라.
2) 위의 결과를 『eStatU』를 이용하여 확인하라.

<풀이>

1) 보수적 의사결정 방식에서는 대립가설이 $H_{1}:\mu{=}1580$ 으로 바뀌었어도 $\mu$ > 1500 보다 크므로 가설의 선택기준은 변하지 않는다. 즉,

‘$\bar{X}$ < 1500 + (1.645)$\frac{200}{}\sqrt{30}$ = 1560.06 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

따라서 2종오류의 확률은 다음과 같다.

$\beta$ = $\mathrm{P}$($\bar{X}$ < 1560.06 ∣ $H_{1}$ 이 참일 때)
= $\mathrm{P}$( (${\bar{X}}$-1580)/(200/$sqrt30$) < (1560.06-1580)/(200/$sqrt30$) )
= $\mathrm{P}$($Z$ < -0.546) = 0.293

2) 『eStatU』를 이용하여 2종오류의 확률을 구하려면 <그림 7.4.1>의 창에서 $\mu_{1}=1580$을 입력하고 실행버튼을 클릭하면 된다.

[예 7.4.2 풀이끝]

 

[예 7.4.1]과 [예 7.4.2]를 비교하면 대립가설이 $H_{1}:\mu{=}1580$ 일 때보다 $H_{1}:\mu{=}1600$ 일 때 2종오류가 발생할 확률이 작기 때문에 판별력이 더 크다고 볼 수 있다. 즉, 대립가설의 모평균이 귀무가설의 모평균에 가까워질수록 판별력이 작아진다.
일반적으로 두 가설검정에 대한 판별력 비교에는 대립가설이 참일 때 이 대립가설을 맞을 확률인 검정력(power of test)이 이용된다.

검정력 = 1 – (2종오류의 확률) = 1 – $\beta$

검정력이 크면 가설검정의 판별력이 커진다. 이러한 2종오류의 확률과 검정력을 임의의 대립가설 $H_{1}:mu=mu_{1}$ 에 대해서 구할 수 있는데, 검정력 1 – $\beta$ 는 $\mu_{1}$의 값이 변함에 따라 다른 값을 가지므로 $\mu_{1}$에 대한 함수이다. 이 함수를 검정력 함수(power function)라고 한다.
두 가설검정의 판별력 비교에는 귀무가설이 참일 때 이 귀무가설을 맞다라고 할 확률을 운영특성함수(operating characteristic function)라 한다.

운영특성함수 = 1 – (1종오류의 확률) = 1 – $\alpha$

[예 7.4.3] [예 7.1.1]의 전구수명에 대한 가설검정($H_{0}:\mu{=}1500$)에서 대립가설의 모평균이 아래와 같이 변할 때 각 검정의 2종오류 확률과 검정력을 구하라. $\alpha$ = 0.05 이다. 이를 이용하여 검정력 함수를 대략 그려보아라.

1) $H_{1}$ : $\mu$ = 1500 2) $H_{1}$ : $\mu$ = 1510 3) $H_{1}$ : $\mu$ = 1520
4) $H_{1}$ : $\mu$ = 1530 5) $H_{1}$ : $\mu$ = 1540 6) $H_{1}$ : $\mu$ = 1550
7) $H_{1}$ : $\mu$ = 1560 8) $H_{1}$ : $\mu$ = 1570 9) $H_{1}$ : $\mu$ = 1580
10) $H_{1}$ : $\mu$ = 1590 11) $H_{1}$ : $\mu$ = 1600 12) $H_{1}$ : $\mu$ = 1610

<풀이>

대립가설이 다르더라도 위의 모든 가설검정의 선택기준은 다음과 같다.

‘$\bar{X}$ < 1500 + (1.645)$\frac{200}{}\sqrt{30}$ = 1560.06 이면 $H_{0}$ 채택, 아니면 $H_{0}$ 기각’

따라서 [예 7.4.2]와 같은 방법으로 2종오류의 확률을 구하고 검정력을 계산하면 아래와 같다.

대립가설

2종오류확률()

검정력

1) $H_{1} : \mu = 1500$

0.95

0.05

2) $H_{1} : \mu = 1510$

0.91

0.09

3) $H_{1} : \mu = 1520$

0.86

0.14

4) $H_{1} : \mu = 1530$

0.79

0.21

5) $H_{1} : \mu = 1540$

0.71

0.29

6) $H_{1} : \mu = 1550$

0.61

0.39

7) $H_{1} : \mu = 1560$

0.50

0.50

8) $H_{1} : \mu = 1570$

0.39

0.61

9) $H_{1} : \mu = 1580$

0.29

0.71

10) $H_{1} : \mu = 1590$

0.21

0.79

11) $H_{1} : \mu = 1600$

0.14

0.86

12) $H_{1} : \mu = 1610$

0.09

0.91

각 대립가설의 평균에 대한 검정력을 선으로 이어 검정력 함수를 대략 그려보면 <그림 7.4.3>과 같다.

[그림 7.4.3] [예 7.4.1]의 검정력 함수 – 우측검정

[예 7.4.3 풀이끝]

 

양측검정인 경우에는 귀무가설의 양쪽에 2종오류가 나올 수 있으므로 검정력 함수는 V자 모양을 갖는다. V자형 계곡이 깊으면 일반적으로 가설에 대한 판별력이 크다고 볼 수 있다.

 

7.4.2 α와 β 가설검정

만일 표본의 크기가 미리 정하여져 있지 않고 분석자가 정할 수 있다면 $\alpha$와 $\beta$를 원하는 수준으로 하는 가설검정을 아래의 예와 같이 할 수 있다.

[예 7.4.4] 전구수명에 대한 가설검정 $H_{0}:\mu{=}1500$, $H_{1}:\mu{=}1570$ 에서 1종오류의 확률($\alpha$)을 5%, 2종오류의 확률($\beta$)을 10%로 하는 표본의 크기와 이때의 선택기준을 정하여라. 모표준편차($\sigma$)는 200시간으로 가정하자.『eStatU』를 이용하여 결과를 확인하라.

<풀이>

표본의 크기를 $n$ 이라 하고 임계값을 $C$ 라고 할 때, 1종오류와 2종오류의 확률은 정의에 의해 다음과 같다.

$\alpha$ = $P$($\bar{X}$ > $C$ ∣ $H_{0}$ 가 참일 때)
$\beta$ = $P$($\bar{X}$ < $C$ ∣ $H_{1}$ 이 참일 때)

표본평균의 표집분포이론에서 $H_{0}$ 가 참일 때는 $\bar{X}$의 분포는 $N(1500,\frac{200^2}{n})$ 이고, $H_{1}$ 이 참일 때는 $\bar{X}$의 분포는 $N(1570,\frac{200^2}{n})$ 이다. 따라서 $\alpha$ = 0.05, $\beta$ = 0.10, $z_{0.05}$ = 1.645, $z_{0.90}$ = -1.280 이므로 다음 두 식이 성립된다.

$C$ = 1500 + 1.645 × (200/$sqrtn$)
$C$ = 1570 – 1.280 × (200/$sqrtn$)

위의 두 식은 미지수가 $n$ 과 $C$ 인 연립방정식이므로 해를 구하면 $n$ = 69.8, $C$ = 1539.4 가 된다. 즉, 표본의 크기는 대략 70이고, 선택기준은 다음과 같다.

‘$\bar{X}$ > 1539.4 이면 $H_{0}$를 기각하고, 아니면 $H_{0}$ 채택’

『eStatU』에서 ‘모평균 가설검정 : $\alpha,\beta$’를 선택하여 나타나는 <그림 7.4.1>과 같은 창에서 [$\alpha,\beta$ 가설검정 모평균]을 선택하고 $\mu_{0}=1500$, $\mu_{1}=1570$, $\alpha{=}0.05$, $\beta{=}0.10$을 입력한다.

[그림 7.4.4] 『eStatU』의 가설검정
실행 버튼을 클릭하면 <그림 7.4.5>와 같은 『eStatU』가설검정 결과가 나타나고 기준선 $C$와 표본 크기 $n$이 표시된다.

[그림 7.4.5] 『eStatU』 가설검정에서 표본 크기 결정

[예 7.4.4 풀이끝]

 

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다