7. 한 모집단 모수의 가설검정

7.1 모평균 가설검정

한 모집단 모수의 가설검정에 대한 예는 다음과 같다.

1) 어느 과자제품의 겉봉지에 용량이 200g이라 표시되어 있다. 과연 표시된 용량만큼 과자가 들어있을까?
2) 어느 전구공장에서 새로 개발한 전구가 과거의 것보다 훨씬 전구 수명이 길다고 선전한다. 과연 이 선전이 믿을만 할까?
3) 금년도 대입 학력고사를 치르고 난 직후 학생들은 영어 성적 평균이 5점정도 작년보다 증가될 것이라고 한다. 이것이 사실인지 어떻게 조사할 수 있나?

위와 같은 의문(가설)에 대한 답을 주는 것이 가설검정(hypothesis testing)이다. 즉, 가설검정은 표본을 이용하여 미지의 모집단 모수에 대한 두 가지 가설을 놓고 어느 가설을 선택할 것인지 통계적으로 의사결정을 하는 것이다. 이 장에서는 가설검정에서 가장 많이 이용되는 모평균, 모분산 및 모비율의 검정에 대하여 알아보자.
다음은 한 모집단에서 모평균의 가설검정에 대한 이론을 예를 이용하여 설명한 것이다.

[예 7.1.1] 어느 전구 공장에서 기존의 생산방식으로 만들어진 전구의 평균수명은 1500시간, 표준편차는 200시간으로 알려져 있다. 최근 이 회사에서 새로운 생산방식을 도입하려는데, 이 방식으로 생산된 전구는 평균수명이 1600시간이라고 한다. 이와 같은 주장을 확인하기 위해 30개의 표본을 단순임의 추출하여 표본평균을 구하여 보니 $\bar{x}$ = 1555 이었다. 과연 새 방식의 전구수명이 1600시간이라고 할 수 있는가?

<풀이>

이 문제의 질문에 대한 답을 통계적으로 접근하는 방법은 먼저 모평균($\mu$)에 대한 서로 다른 주장에 대해 두개의 가설을 세운다. 즉,

$H_{0}$: $\mu$ = 1500 $H_{1}$: $\mu$ = 1600

여기서 $H_{0}$를 귀무가설(null hypothesis), $H_{1}$을 대립가설(alternative hypothesis)이라 부른다. 대개의 경우에 귀무가설 $H_{0}$는 기존의 알려져 있는 사실로 정하고, 대립가설은 새로운 사실 또는 현재의 믿음에 변화가 있는 사실을 정한다. 그래서 두 가설 중 하나를 선택할 때, ‘확실한 근거가 있기 전에는 대립가설(변화된 사실)을 선택하지 않고 귀무가설(현재의 사실)을 받아들인다’는 것이 가설검정의 기본적인 생각이다. 이러한 가설검정을 보수적 의사결정방법 (conservative decision making)이라고 한다.
두 개의 가설 중 하나를 선택하는 상식적인 기준은 ‘표본평균이 어느 가설에 더 가까운가’일 것이다. 이러한 거리개념을 이용하는 상식적 기준에 의하면 표본평균 1555이 $H_{1}$: $\mu$ = 1600에 더 가까우므로 대립가설을 선택할 것이다. 통계적 가설검정도 상식적 기준에 근거한 것인데 다만 $\bar{X}$의 표본분포 이론도 함께 고려한 것이다. 즉, 통계적 가설검정은 $\bar{X}$의 표집분포 이론에 근거한 기준값(critical value) $C$ 를 선정한 후 (다음 쪽에 설명이 나옴)
‘$\bar{X}$가 $C$보다 작으면 가설 $H_{0}$를 채택, 아니면 $H_{0}$를 기각($H_{1}$ 채택)’ 이라는 선택기준(decision rule)으로 한 가설을 선택하게 된다. 이때 $\bar{X}$가 $C$ 보다 작은 영역 {$\bar{X}$ < $C$}를 $H_{0}$ 채택역(acceptance region), $\bar{X}$가 $C$ 보다 큰 영역 {$\bar{X}$ ≥ $C$}를 $H_{0}$ 기각역(rejection region)이라 부른다(<그림 7.1.1>).

[그림 7.1.1] 채택역과 기각역
이러한 선택방법에 의해 한 가설을 선택하게 되면 반드시 그 결정에는 두 가지 오류의 가능성이 있다. 즉, $H_{0}$가 참일 때 $H_{1}$ 을 채택하는 1종오류(Type I Error)와 $H_{1}$이 참일 때 $H_{0}$를 채택하는 2종오류(Type II Error)가 있다. 이들을 표로 요약하면 다음과 같다.

표 7.1.1 가설검정의 오류

실제 상황

$H_{0}$ 참

$H_{1}$ 참

검정결과:

$H_{0}$ 채택

옳은 결정

2종오류

$H_{1}$ 채택

1종오류

옳은 결정

이 두 가지 오류는 표본의 크기가 일정할 때 어느 한 오류를 줄이려고 하면 다른 오류가 커지게 된다. 그래서 귀무가설 $H_{0}$를 ‘과거나 현재의 사실’로 하고 ‘확실한 근거가 없는 한 귀무가설을 채택’하는 보수적 결정방식을 생각해 낸 것이다. 이러한 보수적 방식에서는 ‘귀무가설이 참인데 대립가설을 선택’하는 1종오류가 우리에게 더 큰 손실을 가져오므로 이를 가능하면 줄이려고 노력한다. 즉, 통계적 가설검정에서는 1종오류가 발생할 확률의 허용한계(대개 5%이나, 엄격한 검정에서는 1%를 사용)를 결정하여, 이 한계를 만족시키는 선택기준을 이용한다. 이 1종오류가 발생할 확률의 허용한계를 유의수준(significance level)이라 하며 흔히 $\alpha$로 나타낸다. 2종오류의 확률은 대개 $\beta$로 표시한다.
유의수준만 정하면 5장의 표본평균의 표집분포를 이용하여 두 가설에 대한 선택기준을 마련할 수 있다. <그림 7.1.2>는 두 개의 가설에 대한 가상적인 모집단의 분포와, 각 모집단에 대한 모든 가능한 표본평균의 표집분포를 그린 것이다.

[그림 7.1.2] 통계적 가설검정
표본평균의 표집분포는 중심극한정리에 의해 근사적으로 $H_{0}$ : $\mu$ = 1500 의 모집단인 경우 $N(1500,\frac{200^2}{30})$이고, $H_{1}$ : $\mu$ = 1600 의 모집단인 경우 $N(1600,\frac{200^2}{30})$이 된다. 여기서 각 모집단의 표준편차는 과거의 자료인 200으로 가정하였다. 이때

‘$\bar{X}$가 $C$보다 적으면 $\mathrm{H_{0}}$를 채택하고, $\bar{X}$가 $C$보다 크면 $H_{1}$ 을 채택’

하는 선택기준을 세우면 그림의 빗금 친 부분이 1종오류가 발생할 확률을 나타낸다. 만일에 유의수준, 즉, 1종오류 발생확률의 허용한계를 5%로 하면 (즉, $P$($\bar{X}$ < $C$) = 0.95) $C$는 정규분포이론에 의해

$1500+1.645\frac{200}{}\sqrt{30}$ = $1560.06$

가 된다. 따라서 선택기준은 다음과 같다.

‘${\bar{X}}<1500+1.645\frac{200}{\sqrt{30}}=1560.06$ 이면 $H_{0}$를 채택하고, 아니면 $H_{0}$를 기각($H_{1}$ 채택).’

이 문제에서는 확률변량 $\bar{X}$의 관찰된 표본평균 ${\bar{x}}$ = 1555 이므로 $H_{0}$를 채택한다. 즉, $H_{0}$ : $\mu$ = 1500 인 가설이 맞다고 판정하는 것인데 이는 상식적 기준에 의한 결과와 상반되는 것이다. 그 이유는 보수적 의사결정 방식이기 때문에 표본의 결과가 귀무가설을 기각할 충분한 근거가 되지 못한다는 것이다.
위의 선택기준은 보수적 결정방식에 의한 결과라는 것을 강조하는 의미로 다음과 같이 쓰기도 한다.

‘$\bar{X}$ < 1560.06 이면 $H_{0}$를 기각하지 못하고, 아니면 $H_{0}$를 기각.’

또 위의 선택기준은 계산편의상 아래와 같이 쓰기도 한다.

‘$\frac{\bar{X}{-}{1500}}{\frac{200}{\sqrt{30}}}<1.645$ 이면 $H_{0}$를 채택, 아니면 $H_{0}$ 기각.’
이 경우 ${\bar{x}}$ = 1555 일 때 $\frac{1555-1500}{\frac{200}{\sqrt{30}}}=1.506$ 은 1.645보다 작으므로 $H_{0}$를 채택한다.

[예 7.1.1 풀이끝]

 

[예 7.1.1]에서 보았듯이 보수적 결정방식에 의한 가설검정에서는 1종오류가 발생할 확률에 근거한 선택기준을 만들었기 때문에, 대립가설 $H_{1}$ : $\mu$ = 1600 은 선택기준에 단지 ‘가설 $H_{0}$ 의 모평균($\mu$= 1500)보다 크다’라는 점만 고려되었다. 즉, [예 7.1.1]에서 대립가설을 $H_{1}$ : $\mu$ > 1500 이라 하여도 똑같은 계산에 의해 $H_{0}$를 기각한다는 결론을 내릴 수 있다.
일반적으로 모평균에 대한 가설검정에서 대립가설의 형태는 크게 다음 세 가지이다.

1) $H_{1}$ : $\mu$ > $\mu_{0}$ 2) $H_{1}$ : $\mu$ < $\mu_{0}$ 3) $H_{1}$ : $\mu$ ≠$\mu_{0}$

1)은 가설 $H_{0}$ 오른쪽에 기각역을 가지므로 우측검정(right-sided test), 2)는 가설 $H_{0}$ 왼쪽에 기각역을 가지므로 좌측검정(left-sided test), 3)은 가설 $H_{0}$ 양편에 기각역을 가지므로 양측검정(two-sided test)이라 부른다. 모표준편차를 알 경우(현실적이지는 못하지만 이론을 전개시키기 위한 것임) 각각의 형태에 대한 가설의 선택기준은 표 7.1.2와 같다. 여기서 $\alpha$는 유의수준이다.

표 7.1.2 모평균의 가설검정 – 모표준편차 $\sigma$를 모르는 경우 (모집단이 정규분포)

가설의 종류

선택 기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{>}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}{>}{z}_{\mathit{\alpha}}$ 이면 $H_{0}$ 기각

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{<}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}{<}{-}{z}_{\mathit{\alpha}}$ 이면 $H_{0}$ 기각

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{\ne}{\mathit{\mu}}_{0}$

$\left|{\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}}\right|{>}{z}_{\mathit{\alpha}{/}{2}}$ 이면 $H_{0}$ 기각

참고: 1)의 경우 $H_{0}:\mu{\leq}\mu_{0}$ 로, 2)의 경우 $H_{0}:\mu{\geq}\mu_{0}$로 쓸 수 있다.

선택기준에 사용되는 다음 식

${\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{\mathit{\sigma}}{\sqrt{n}}}}$

를 검정통계량(test statistic)이라고 부른다. 일반적으로 모표준편차 $\sigma$ 는 미지수이다. 그러나 표본의 크기가 충분히 클 경우(대략 30이상) 위의 가설검정 공식에서 $\sigma$ 대신 표본표준편차 $S$를 이용하여 모평균의 가설검정을 할 수 있다.
[예 7.1.1]에서 ${\bar{X}}$가 1555 일 경우나 1540 일 경우 모두 가설 $H_{0}$ 는 기각되지 못하지만 기각되지 못한 근거의 정도가 다르다. 가설이 기각되지 못한 근거의 정도는 관찰된 표본평균의 값을 기준값으로 하였을 때의 1종오류 확률을 계산하면 알 수 있는데 이를 $p$-값($p$-value)이라 한다. 즉, $p$-값은 측정된 표본평균이 모든 가능한 표본평균 중에서 어디에 위치하고 있는지를 알려 준다. ${\bar{X}}$가 1540일 경우의 $p$-값은, ${\bar{X}}$가 1555일 경우의 $p$-값보다 크다. $p$-값은 더 클수록 기각되지 못한 강력한 근거가 된다(귀무가설 $H_{0}$가 기각되는 경우는 더 작을수록 기각된 근거가 더 강력하다). 따라서 $p$-값이 분석자가 고려하는 유의수준보다 작으면 표본평균이 기각역에 있다는 것을 뜻하기 때문에 $H_{0}$를 기각한다. 대부분의 통계패키지에서는 $p$-값을 계산하여 준다.

☞ ${$p-}$값을 이용한 가설 선택기준
${$p-}$값이 유의수준보다 작으면 $H_{0}$기각, 아니면 $H_{0}$ 채택

구체적으로 각각의 검정형태에 따른 $p$-값의 계산은 아래와 같다.

표 7.1.3 $p-$값의 계산

가설의 종류

선택 기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{>}{\mathit{\mu}}_{0}$

${P}\left({\bar{X}{>}{\bar{x}}_{obs}}\right)$

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{<}{\mathit{\mu}}_{0}$

${P}\left({\bar{X}{<}{\bar{x}}_{obs}}\right)$

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{\ne}{\mathit{\mu}}_{0}$

${\bar{X}}_{obs}{>}{\mathit{\mu}}_{0}$ 이면 $2{P}\left({\bar{X}{>}{\bar{x}}_{obs}}\right)$, 아니면 $2{P}\left({\bar{X}{<}{\bar{x}}_{obs}}\right)$

참고: ${\bar{x}}_{obs}$는 관찰된 표본평균의 값을 뜻한다.

모표준편차 $\sigma$를 모르는 경우 모집단이 정규분포를 따른다면 검정통계량

$({\bar{X}}\textit{-}\mu_{0})/(\frac{S}{\sqrt{n}})$

는 자유도가 (n-1)인 $t$분포를 따르므로 모평균 가설검정은 표 7.1.2의 선택기준에서 표준정규분포 대신 $t$분포를 사용하여 다음과 같다.

표 7.1.4 모평균의 가설검정 – 모표준편차 를 모르는 경우 (모집단이 정규분포)

가설의 종류

선택 기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{>}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{S}{\sqrt{n}}}{>}{t}_{{n}{-}{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\alpha}}$ 이면 $H_{0}$ 기각

2) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{<}{\mathit{\mu}}_{0}$

$\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{S}{\sqrt{n}}}{<}{-}{t}_{{n}{-}{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\alpha}}$ 이면 $H_{0}$ 기각

3) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{=}{\mathit{\mu}}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\mu}{\ne}{\mathit{\mu}}_{0}$

$\left|{\frac{\bar{X}{-}{\mathit{\mu}}_{0}}{\frac{S}{\sqrt{n}}}}\right|{>}{t}_{{n}{-}{1}\hspace{0.33em}{:}\hspace{0.33em}\mathit{\alpha}{/}{2}}$ 이면 $H_{0}$ 기각

참고: 1)의 경우 $H_{0}:\mu{leq}\mu_{0}$ 로, 2)의 경우 $H_{0}:\mu{geq}\mu_{0}$로 쓸 수 있다.

표본의 크기가 충분히 클 경우(대략 30이상) $t$분포는 정규분포에 근사하므로 표 7.1.2의 가설검정 공식에서 $\sigma$ 대신 표본표준편차 $S$ 를 이용하여 모평균의 가설검정을 할 수 있다.

[예 7.1.2] 어느 과자 봉지에 적혀있는 무게가 250g이다. 과자의 무게는 정규분포라 가정하자. 과자 표본 100개를 조사하였더니 평균이 253g, 표준편차가 10g이었다.

1) 과자의 무게가 250g인지, 아니면 이보다 큰지 검정하고 $p$-값을 구하라. $\alpha$ = 1%
2) 과자의 무게가 250g인지, 아닌지 검정하고 $p$-값을 구하라. $\alpha$ = 1%
3)『eStatU』을 이용하여 위의 가설검정을 하라.

<풀이>

1) 이 문제의 가설은 $H_{0}$: $\mu$ = 250, $H_{1}$: $\mu$ > 250 인 우측검정이다. 표본의 크기가 크므로 ($n$=100) $t$분포 대신에 표준정규분포를 사용하여도 무방하다. 선택기준은 다음과 같다.

‘${({\bar{X}}-\mu_{0}})/({\frac{S}{\sqrt{n}})>z}_\alpha$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘$(253-250)/(\frac{10}{\sqrt{100}})>z_{0.01}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 (253-250) / (10/10) = 3, $z_{0.01}$ = 2.326 이므로 $H_{0}$ 는 기각이 된다. 가설의 선택기준을 아래와 같이 쓸 수도 있다.

‘${\bar{X}}>250+2.326({\frac{10}{\sqrt{100}}})$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘${\bar{X}}>252.326$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

$p$-값은 표본평균을 기준값으로 했을 때의 1종오류의 확률이므로 표본평균이 253보다 클 확률을 구하면 된다. $H_{0}$: $\mu$ = 250 이 참이라는 가정 하에서 $\bar{X}$의 분포는 근사적으로 $N(250,100over100)$인 분포이므로

$p$-값 = $\mathrm{P}$(${\bar{X}}$ > 253) = $\mathrm{P}$($Z$ > (253-250)/(10/10)) = $\mathrm{P}$($Z$ > 3) = 0.0013

이다. 여기서 (253-250)/(10/10) = 3 는 위에서 이미 계산했던 검정통계량의 값임을 주목하면, $p$-값은 바로 검정통계량의 분포(여기서는 표준정규분포)를 이용하여 구할 수 있다.
2) 이 예의 가설은 $H_{0}$: $\mu$ = 250, $H_{1}$: $\mu$ ≠ 250 인 양측검정이다. 표본의 크기가 크므로 ($n$ = 100) 가설 선택기준은 다음과 같다.

‘${\left|\frac{{{\bar{X}}-\mu_{0}}}{\frac{S}{\sqrt{n}}}\right|>z_{}alpha/2}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘${\left|\frac{{{253}-250}}{\frac{10}{\sqrt{100}}}\right|>z}_{0.005}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 (253-250) / (10/10) = 3, $z_{0.005}$ = 2.575 이므로 $H_{0}$ 는 기각이 된다. $p$-값은 표본평균을 기준값으로 했을 때의 1종오류의 확률이므로 표본평균이 53보다 클 확률을 구하여 2를 곱하면 된다. $H_{0}$: $\mu$ = 50 이 참이라는 가정 하에서 $\bar{X}$의 분포는 근사적으로 N(250, 100/100)인 분포이므로 $p$-값은 다음과 같다.

$p$-값 = 2$P$($\bar{X}$ > 53) = 2$P$($Z$ > (53-50)/(10/10)) = 2P($Z$ > 3) = 0.0026

3) 『eStatU』에서 ‘추정 및 가설검정 : 모평균 $\mu$’를 선택하여 나타나는 <그림 7.1.3>과 같은 창에서 대립가설을 우측검정으로 선택하고, [검정형태]를 ‘$Z$ 검정’을 체크한다. 그리고 유의수준을 5%로 체크하고, 표본크기 100, 표본평균 253, 표본분산은 $10^2=100$을 입력한다. $Z$ 검정의 경우 모분산을 입력하여야 하나 표본의 크기가 충분히 크므로 표본분산을 입력해도 좋다.

『eStatU』가설검정 결과는 <그림 7.1.4>와 같다.

[그림 7.1.4] 『eStatU』를 이용한 $Z$우측 검정 결과
<그림 7.1.3>에서 대립가설을 양측검정을 선택하고 실행하면 <그림 7.1.5>와 같은 결과가 나타난다.

[그림 7.1.5] 『eStatU』를 이용한 양측 검정 결과

[예 7.1.2 풀이끝]

 

[예 7.1.3] [예 7.1.2]의 1) 문제에서 표본의 크기가 16개일 때 과자의 무게가 250g인지 아니면 이보다 큰지 검정하고 $p$-값을 구하라. 『eStatU』를 이용하여 결과를 확인하라.

<풀이>

모표준편차를 모르고 소표본이므로 가설 선택기준은 다음과 같다.

‘$({\bar{X}}\textit{-}\mu_{o})/(\frac{S}{\sqrt{n}})>t_{n-1;\alpha{}}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’
‘${(}{253}{-}{250}{)/(}\frac{10}{\sqrt{16}}{)}{>}{t}_{{16}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}{0}{.}{01}}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 ${(253-250})/({\frac{10}{\sqrt{16}}})=1.2,t_{15,0.01}=2.602$ 이므로 $H_{0}$가 채택이 된다.
가설 선택기준을 다음과 같이 적을 수도 있음을 유의하라.

‘${{\bar{X}}>250}+2.602({\frac{10}{\sqrt{16}}})$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

<그림 7.1.3>에서 대립가설을 우측검정, [검정형태]로 $t$ 검정을 선택하고 표본의 크기 $n$ = 16으로 하여 실행하면 <그림 7.1.6>과 같은 결과가 나타난다.

<그림 7.1.6> 『eStatU』를 이용한 $t$분포 우측검정 결과

$p$-값은 $t_{15}$분포에서 검정통계량의 값 1.2 보다 클 확률이므로 『eStatU』프로그램을 이용하면 0.124임을 알 수 있다.

[예 7.1.3 풀이끝]

 

[예 7.1.4] (『eStat』실습)
남자 대학생 10명을 표본 추출하여 신장을 조사하니 다음과 같다. (단위 cm)

172 175 178 182 176 180 169 185 173 177

모평균이 175cm 인지 아니면 이보다 큰지 유의수준 5%로 가설검정하라.

<풀이>

『eStat』에서 시트에 <그림 7.1.7>과 같이 데이터를 입력한 후 모평균 가설검정 아이콘 를 클릭하고 변량선택박스‘에서 ’분석변량‘을 V1 선택하면 데이터의 평균-신뢰구간 점그래프가 나타난다(<그림 7.1.8>).

[그림 7.1.8] 『eStat』을 이용한 점그래프 및 평균 신뢰구간
[그림 7.1.7] 『eStat』 데이터 입력
[그림 7.1.10] 데이터의 히스토그램과 정규분포 곡선
그래프 창 밑의 선택 창(<그림 7.1.9>)에서 ‘히스토그램’을 클릭하면 <그림 7.1.10>과 같이 데이터에 대한 히스토그램과 정규분포곡선이 출력되어 데이터가 정규분포인지 대략 검사할 수 있다. ‘정규 Q-Q산점도’, ‘정규적합성검정’은 11장에서 설명한다.

[그림 7.1.9] 모평균 가설검정의 선택사항
[그림 7.1.11] 모평균 가설검정의 그래프
선택 창에서 <그림 7.1.9>과 같이 $\mu_{0}$ = 170을 입력하고, 대립가설 형태를 우측검정, 유의수준을 5%로 선택하고 ‘$t$ 검정(Z)’ 버튼을 누르면 <그림 7.1.11>과 같은 가설검정 그래프가 나타나고 로그창에 검정결과가 나타난다(<그림 7.1.12>).

[그림 7.1.12] 모평균 가설검정의 결과
선택 창에서 Z 검정을 선택할 수도 있다. 이 경우에는 모표준편차 $\sigma$를 입력하여야 한다.

[예 7.1.4 풀이끝]

 

표본분산을 이용한 모평균의 가설검정은 모집단이 정규분포를 한다는 가정이 필요하다. 표본 데이터를 이용하여 모집단이 정규분포인지 검정하는 것을 적합성검정이라 한다. 『eStat』의 모평균 가설검정 선택사항에서 ‘히스토그램’을 선택하면 <그림 7.1.9>와 같은 데이터의 히스토그램과 정규분포 그래프를 같이 그려져 대략적인 정규성 검정을 할 수 있다. 자세한 내용은 11장에서 살펴본다.
이 절에서는 표본의 크기가 이미 주어진 경우에 어떻게 가설검정하는지 알아보았다. 표본의 크기가 일정할 경우에 1종오류의 가능성을 줄이려고 하면 2종오류의 가능성이 커지므로 두 종류의 오류를 동시에 줄일 수는 없다. 따라서, 표본의 크기가 미리 정해졌거나, 자료가 주어진 경우에는 보수적 결정방법으로 1종오류만을 고려하는 가설검정을 하였다. 그러나 만일 표본의 크기를 조절할 수 있다면 두 종류의 오류를 함께 고려하는 가설검정 방법도 있다. 자세한 내용은 7.4절에서 살펴본다.

 

7.2 모분산 가설검정

모집단의 분산을 가설검정하기 위한 예는 다음과 같다.

1) 한 자동차회사에 현재 볼트를 납품하는 부품회사의 볼트는 직경이 평균 7mm, 분산이 0.25라고 한다. 최근 경쟁회사는 자기회사의 볼트는 직경의 평균이 7mm, 분산이 0.16이라고 주장하면서 납품을 신청하고 있다. 과연 이 주장이 맞는지 어떻게 알아볼 수 있는가?
2) 작년도 대입 학력고사 수학점수의 분산이 100 이라 한다. 금년도 수학 문제가 작년보다 너무 쉽다고 한다. 학력고사 성적의 분산이 작년보다 작아졌는지 어떻게 알아 볼 수 있나?

모평균에 대한 가설검정을 이해하면 모분산의 가설검정은 표본분포와 검정통계량만 다르고 기본적인 개념은 같다. 5장에서 표본분산($S^2$)의 분포는 모집단의 분산이 $\sigma^2$인 정규분포를 따를 때 표본의 크기가 $n$이라면 $(n-1)S^2/sigma^2$은 자유도가 ($n-1$)인 카이제곱분포를 하는 것을 알았다. 이 이론을 이용하면 모분산에 대한 가설검정을 다음과 같이 할 수 있다.

표 7.2.1 모분산의 가설검정 – 모집단이 정규분포인 경우

가설의 종류

선택기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{=}\sigma^2_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{>}\sigma^2_{0}$

$\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{>}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\mathit{\alpha}}^{2}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{=}\sigma^2_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{<}\sigma^2_{0}$

$\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{<}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\mathit{\alpha}}^{2}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2{=}\sigma^2_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}\sigma^2\ne\sigma^2_{0}$

$\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{>}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\mathit{\alpha}{/}{2}}^{2}$ 또는 $\frac{\left({{n}{-}{1}}\right){S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{<}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}{1}{-}\mathit{\alpha}{/}{2}}^{2}$ 이면 $H_{0}$기각, 아니면 $H_{0}$채택

참고: 1)에서 $H_{0}:\sigma^2\leq\sigma_{o}^2$으로, 2)에서 $H_{0}:\sigma^2\geq\sigma_{o}^2$로 쓸 수 있다.

[예 7.2.1] 자동차 부속품 중 볼트를 생산하는 회사가 있다. 이 볼트 직경의 규격은 15mm인데 분산이 ${0.10}^2$ 이내라면 납품할 수 있다. 최근에 생산된 제품 중 25개를 단순임의 표본추출하여 분산을 조사하였더니 $0.15^2$이었다. 볼트의 직경이 정규분포를 따른다고 가정하였을 때,

1) 최근 생산된 제품을 납품할 수 있는지 5% 유의수준으로 가설 검정을 하여라.
2) 『eStatU』를 이용하여 결과를 확인하라.

<풀이>

1) 이 문제의 가설은 $H_{0} : \sigma^2\leq0.1^{2}$ $H_{1} : \sigma^2 > 0.1^{2}$이다. 따라서 선택기준은

$\frac{{(}{n}{-}{1}{)}{S}^{2}}{{\mathit{\sigma}}_{0}^{2}}{>}{\chi}_{{n}{-}{1}\hspace{0.33em}{;}\hspace{0.33em}\alpha}^{2}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택

이다. $s^{2}$ = $0.15^{2}=0.0225$ 이므로 (25-1)×$0.15^{2}$/$0.1^{2}$ = 54이고, $\chi_{25-1;0.05}^{2}$ = $\chi_{24;0.05}^{2}$= 36.42 이다. 따라서 가설 $H_{0}$가 기각된다.
2)『eStatU』에서 ‘추정 및 가설검정 : 모분산 $\sigma^2$’를 선택하여 나타나는 <그림 7.2.1>과 같은 창에서 모분산 $\sigma_{0}^2$ = $0.1^2=0.01$ 를 입력하고, 대립가설을 우측검정으로 선택, 유의수준을 5%, 표본크기 $n$ = 25, 표본분산 $s^2=0.15^{2}=0.0225$를 입력한다.

[그림 7.2.1] 『eStatU』의 모분산 가설검정
‘실행’ 버튼을 누르면 $\sigma^2$의 신뢰구간이 계산되고 『eStatU』가설검정 결과는 <그림 7.2.2>와 같다.

[그림 7.2.2] 『eStatU』를 이용한 모분산 우측 가설검정 결과

[예 7.2.1 풀이끝]

 

[예 7.2.2] (『eStat』실습)
[예 7.1.4]의 남자 대학생 10명에 대한 신장 데이터 (172 175 178 182 176 180 169 185 173 177)에서 모분산이 $5^2$인지 아니면 이보다 큰지 유의수준 5%로 가설검정하라.

<풀이>

『eStat』에서 시트에 <그림 7.2.3>과 같이 데이터를 입력한 후 모분산 가설검정 아이콘 를 클릭하고 ‘변량선택박스’에서 V1을 선택하면 <그림 7.2.4>와 같은 데이터의 점그래프와 (평균) $+-$ (표준편차) 구간이 나타난다.

[그림 7.2.3] 『eStat』데이터 입력
[그림 7.2.4] 모분산의 가설검정에서 점그래프와 (평균) (표준편차) 구간
그래프 창 밑의 선택창(<그림 7.2.5>)에서 $\sigma_{0}^2$ = 25를 입력하고, 대립가설 형태를 우측검정, 유의수준을 5%로 선택하고 ‘$chi^2$ 검정’ 버튼을 누르면 <그림 7.2.6>와 같은 가설검정 결과 그래프와 결과표(<그림 7.2.7>)가 나타난다.

[그림 7.2.5] 모분산 가설검정의 선택사항
[그림 7.2.6] 모분산 가설검정 결과
[그림 7.2.7] 모분산 가설검정 결과표

[예 7.2.2 풀이끝]

 

모분산의 가설검정도 모집단이 정규분포를 한다는 가정이 필요하다. 표본 데이터를 이용하여 모집단이 정규분포인지 검정하는 것을 적합성검정이라 한다. <그림 7.2.4>의 모분산 가설검정 선택사항에서 ‘히스토그램’을 선택하면 히스토그램과 정규분포 함수를 같이 그려 대략적인 정규성 검정을 할 수 있다. 이밖에 ‘정규 적합성검정’과 ‘정규 Q-Q 산점도’를 이용할 수 있는데 자세한 내용은 11장에서 살펴본다.

 

7.3 모비율 가설검정

모집단의 미지의 비율에 대한 가설검정이 필요한 몇 가지 예를 들어보자.

1) 금년도 대통령 선거에서 특정 후보의 지지율이 과연 50%를 넘을까?
2) 작년도 실업률이 7%이었다고 한다. 올해의 실업률은 높아졌는가?
3) 자동차 부속품 1만개를 배로 수입하는데 과거의 경험으로 보아 이중 2%가 불량품이었다. 이번에도 불량품이 2%일까?

표본의 크기가 충분히 클 때 표본비율($hatp$)의 표집분포는 평균이 모비율($p$)이고 분산이 $p(1-p)/n$ 인 정규분포에 근사하게 된다. 따라서 대표본일 때의 모평균 가설검정과 유사하게 모비율의 가설검정을 다음과 같이 할 수 있다.

표 7.3.1 모비율의 가설검정 – 대표본일 경우

가설의 종류

선택기준

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}{p}{=}{p}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}{p}{>}{p}_{0}$

$\frac{\hat{p}{-}{p}_{0}}{\sqrt{{p}_{0}\left({{1}{-}{p}_{0}}\right){/}{n}}}{>}{z}_{\mathit{\alpha}}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}{p}{=}{p}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}{p}{<}{p}_{0}$

$\frac{\hat{p}{-}{p}_{0}}{\sqrt{{p}_{0}\left({{1}{-}{p}_{0}}\right){/}{n}}}{<}{-}{z}_{\mathit{\alpha}}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

1) ${H}_{0}\hspace{0.33em}{:}\hspace{0.33em}{p}{=}{p}_{0}$

${H}_{1}\hspace{0.33em}{:}\hspace{0.33em}{p}\ne{p}_{0}$

$\left|{\frac{\hat{p}{-}{p}_{0}}{\sqrt{{p}_{0}\left({{1}{-}{p}_{0}}\right){/}{n}}}}\right|{>}{z}_{\mathit{\alpha}{/}{2}}$이면 $H_{0}$기각, 아니면 $H_{0}$채택

참고: 구간추정에서와 마찬가지로 대표본의 판정기준은 $np_{0}$ > 5, $n(1-p_{0})$ > 5 임.
1)에서 $H_{0}:p\leqp_{0}$ 로, 2)의 경우 $H_{0}:p\geqp_{0}$ 로 쓸 수 있다.

소표본인 경우는 이항분포를 사용하여 가설검정을 하는데 10장의 부호검정에서 설명한다.

[예 7.3.1] 한 지역의 국회의원 선거여론조사를 지난달 실시한 결과 특정후보의 지지율이 60%이었다. 최근에 지지율에 변동이 있는지 알아보기 위해 100명을 단순임의추출하였더니 55명이 지지를 하였다.

1) 특정후보에 대한 현재 지지율이 60%에서 변동이 있는지 유의수준 5%로 검정하라.
2) 『eStatU』를 이용하여 결과를 확인하라.

<풀이>

1) 이 문제의 가설은 $H_{0}:p=0.6$, $H_{1}:p\neq{0.6}$ 이다. $np_{0}$ = 60, $n(1-p_{0})$ = 40 이므로 대표본이라 할 수 있고, 따라서 선택기준은 다음과 같다.

‘$\left|\frac{{\hat{p}}-p_{0}}{\sqrt{p_{0}(1-p_{0})/n}}\right|$> $z_{\alpha{/2}}$ 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

$hatp$ = 55/100 = 0.55 이므로

$left|\frac{0.55-0.6}{SQRT{0.6(1-0.6)/100}}right|=left|-1.005right|=1.005$, $z_{0.05/2}$ = $z_{0.025}$ = 1.96

따라서 가설 $H_{0}$를 채택한다.
2) 『eStatU』에서 ‘추정 및 가설검정 : 모비율 $p$’를 선택하여 나타나는 <그림 7.3.1>과 같은 창에서 모비율 $p_{0}=0.6$ 을 입력하고, 대립가설을 양측검정으로 선택, 유의수준을 5%, 표본크기 $n$ = 100, 표본비율 $\hat{p}=0.55$를 입력한다. ‘실행’ 버튼을 누르면 신뢰구간이 계산되고 가설검정 결과는 <그림 7.3.2>와 같다.

[그림 7.3.1] 『eStatU』의 모비율 가설검정 데이터 입력
[그림 7.3.2] 『eStatU』를 이용한 모비율 가설검정 결과

[예 7.3.1 풀이끝]

 

7.4 α와 β를 같이 고려하는 가설검정

지금까지 알아본 가설검정은 보수적 의사결정 방식이므로 귀무가설을 충분한 반대근거가 없는 한 지키려는 사실, 대립가설을 새로운 사실로 하여 1종오류(귀무가설이 참인데도 기각하는 오류)의 확률($\alpha$)을 작게 하는 선택기준을 만들었다. 따라서 2종오류의 확률($\beta$)은 선택기준에 전혀 고려되지 않았다. 하지만 때때로 어느 사실을 귀무가설로 하고, 어느 것을 대립가설로 정해야 하는지가 애매한 경우가 있으며, 문제에 따라서 두 종류의 오류가 모두 현실적으로 중요하여 동시에 고려해야 할 때가 있다. 이 때 만일 표본의 크기를 분석자가 정할 수 있다면 $\alpha$와 $\beta$를 같이 고려하는 가설검정을 할 수 있다.

 

7.4.1 β와 검정력

2종오류의 확률을 구하는 방법을 아래의 예를 통해 알아보자.

[예 7.4.1] [예 7.1.1]의 가설검정에서 2종오류의 확률을 구하라. 유의수준은 5%이다. 이 결과를 『eStatU』를 이용하여 확인하라.

<풀이>

[예 7.1.1]에서 두 가설은 $H_{0}:\mu{=}1500$, $H_{1}:\mu{=}1600$ 이고, 모표준편차는 $\sigma$ = 200, 표본의 크기는 $n$=30 이다. 따라서 가설의 선택기준은 유의수준이 5%이므로 다음과 같다.

‘$\bar{X}$ < 1500 + (1.645)$\frac{200}{}\sqrt{30}$ = 1560.06 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

따라서 ‘$H_{1}$ 이 참인데 $H_{0}$ 가 맞다’라고 하는 2종오류의 확률은 다음과 같다.

$\beta$ = $\mathrm{P}$($\bar{X}$ < 1560.06 ∣ $H_{1}$ 이 참일 때)
= $\mathrm{P}$(($\bar{X}$-1600)/(200/$sqrt30$) < (1560.06-1600)/(200/$sqrt30$) )
= $\mathrm{P}$($Z$ < -1.09) = 0.137

『eStatU』에서 ‘모평균 가설검정 : $\alpha,\beta$’를 선택하여 나타나는 <그림 7.4.1>과 같은 창에서 [$\alpha$ 가설검정 모평균]을 선택하고 $\mu_{0}=1500$, $\mu_{1}=1600$, $\sigma{=}200$, $\alpha{=}0.05$, $n=30$을 입력한다.

[그림 7.4.1] 『eStatU』의 가설검정 모평균]
실행 버튼을 클릭하면 <그림 7.4.2>와 같은 『eStatU』가설검정 결과가 나타나고 기준선 $C$와 2종오류 확률 $\beta$가 표시된다.

[그림 7.4.2] 『eStatU』를 이용한 와 검정력의 계산 결과

[예 7.1.1 풀이끝]

 

[예 7.4.2] [예 7.1.1]의 가설검정에서 귀무가설은 변하지 않고, 대립가설이 아래와 같이 바뀌었다. 유의수준은 5%이다.

$H_{0}:\mu{=}1500$, $H_{1}:\mu{=}1580$

1) 2종오류의 확률을 구하라.
2) 위의 결과를 『eStatU』를 이용하여 확인하라.

<풀이>

1) 보수적 의사결정 방식에서는 대립가설이 $H_{1}:\mu{=}1580$ 으로 바뀌었어도 $\mu$ > 1500 보다 크므로 가설의 선택기준은 변하지 않는다. 즉,

‘$\bar{X}$ < 1500 + (1.645)$\frac{200}{}\sqrt{30}$ = 1560.06 이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

따라서 2종오류의 확률은 다음과 같다.

$\beta$ = $\mathrm{P}$($\bar{X}$ < 1560.06 ∣ $H_{1}$ 이 참일 때)
= $\mathrm{P}$( (${\bar{X}}$-1580)/(200/$sqrt30$) < (1560.06-1580)/(200/$sqrt30$) )
= $\mathrm{P}$($Z$ < -0.546) = 0.293

2) 『eStatU』를 이용하여 2종오류의 확률을 구하려면 <그림 7.4.1>의 창에서 $\mu_{1}=1580$을 입력하고 실행버튼을 클릭하면 된다.

[예 7.4.2 풀이끝]

 

[예 7.4.1]과 [예 7.4.2]를 비교하면 대립가설이 $H_{1}:\mu{=}1580$ 일 때보다 $H_{1}:\mu{=}1600$ 일 때 2종오류가 발생할 확률이 작기 때문에 판별력이 더 크다고 볼 수 있다. 즉, 대립가설의 모평균이 귀무가설의 모평균에 가까워질수록 판별력이 작아진다.
일반적으로 두 가설검정에 대한 판별력 비교에는 대립가설이 참일 때 이 대립가설을 맞을 확률인 검정력(power of test)이 이용된다.

검정력 = 1 – (2종오류의 확률) = 1 – $\beta$

검정력이 크면 가설검정의 판별력이 커진다. 이러한 2종오류의 확률과 검정력을 임의의 대립가설 $H_{1}:mu=mu_{1}$ 에 대해서 구할 수 있는데, 검정력 1 – $\beta$ 는 $\mu_{1}$의 값이 변함에 따라 다른 값을 가지므로 $\mu_{1}$에 대한 함수이다. 이 함수를 검정력 함수(power function)라고 한다.
두 가설검정의 판별력 비교에는 귀무가설이 참일 때 이 귀무가설을 맞다라고 할 확률을 운영특성함수(operating characteristic function)라 한다.

운영특성함수 = 1 – (1종오류의 확률) = 1 – $\alpha$

[예 7.4.3] [예 7.1.1]의 전구수명에 대한 가설검정($H_{0}:\mu{=}1500$)에서 대립가설의 모평균이 아래와 같이 변할 때 각 검정의 2종오류 확률과 검정력을 구하라. $\alpha$ = 0.05 이다. 이를 이용하여 검정력 함수를 대략 그려보아라.

1) $H_{1}$ : $\mu$ = 1500 2) $H_{1}$ : $\mu$ = 1510 3) $H_{1}$ : $\mu$ = 1520
4) $H_{1}$ : $\mu$ = 1530 5) $H_{1}$ : $\mu$ = 1540 6) $H_{1}$ : $\mu$ = 1550
7) $H_{1}$ : $\mu$ = 1560 8) $H_{1}$ : $\mu$ = 1570 9) $H_{1}$ : $\mu$ = 1580
10) $H_{1}$ : $\mu$ = 1590 11) $H_{1}$ : $\mu$ = 1600 12) $H_{1}$ : $\mu$ = 1610

<풀이>

대립가설이 다르더라도 위의 모든 가설검정의 선택기준은 다음과 같다.

‘$\bar{X}$ < 1500 + (1.645)$\frac{200}{}\sqrt{30}$ = 1560.06 이면 $H_{0}$ 채택, 아니면 $H_{0}$ 기각’

따라서 [예 7.4.2]와 같은 방법으로 2종오류의 확률을 구하고 검정력을 계산하면 아래와 같다.

대립가설

2종오류확률()

검정력

1) $H_{1} : \mu = 1500$

0.95

0.05

2) $H_{1} : \mu = 1510$

0.91

0.09

3) $H_{1} : \mu = 1520$

0.86

0.14

4) $H_{1} : \mu = 1530$

0.79

0.21

5) $H_{1} : \mu = 1540$

0.71

0.29

6) $H_{1} : \mu = 1550$

0.61

0.39

7) $H_{1} : \mu = 1560$

0.50

0.50

8) $H_{1} : \mu = 1570$

0.39

0.61

9) $H_{1} : \mu = 1580$

0.29

0.71

10) $H_{1} : \mu = 1590$

0.21

0.79

11) $H_{1} : \mu = 1600$

0.14

0.86

12) $H_{1} : \mu = 1610$

0.09

0.91

각 대립가설의 평균에 대한 검정력을 선으로 이어 검정력 함수를 대략 그려보면 <그림 7.4.3>과 같다.

[그림 7.4.3] [예 7.4.1]의 검정력 함수 – 우측검정

[예 7.4.3 풀이끝]

 

양측검정인 경우에는 귀무가설의 양쪽에 2종오류가 나올 수 있으므로 검정력 함수는 V자 모양을 갖는다. V자형 계곡이 깊으면 일반적으로 가설에 대한 판별력이 크다고 볼 수 있다.

 

7.4.2 α와 β 가설검정

만일 표본의 크기가 미리 정하여져 있지 않고 분석자가 정할 수 있다면 $\alpha$와 $\beta$를 원하는 수준으로 하는 가설검정을 아래의 예와 같이 할 수 있다.

[예 7.4.4] 전구수명에 대한 가설검정 $H_{0}:\mu{=}1500$, $H_{1}:\mu{=}1570$ 에서 1종오류의 확률($\alpha$)을 5%, 2종오류의 확률($\beta$)을 10%로 하는 표본의 크기와 이때의 선택기준을 정하여라. 모표준편차($\sigma$)는 200시간으로 가정하자.『eStatU』를 이용하여 결과를 확인하라.

<풀이>

표본의 크기를 $n$ 이라 하고 임계값을 $C$ 라고 할 때, 1종오류와 2종오류의 확률은 정의에 의해 다음과 같다.

$\alpha$ = $P$($\bar{X}$ > $C$ ∣ $H_{0}$ 가 참일 때)
$\beta$ = $P$($\bar{X}$ < $C$ ∣ $H_{1}$ 이 참일 때)

표본평균의 표집분포이론에서 $H_{0}$ 가 참일 때는 $\bar{X}$의 분포는 $N(1500,\frac{200^2}{n})$ 이고, $H_{1}$ 이 참일 때는 $\bar{X}$의 분포는 $N(1570,\frac{200^2}{n})$ 이다. 따라서 $\alpha$ = 0.05, $\beta$ = 0.10, $z_{0.05}$ = 1.645, $z_{0.90}$ = -1.280 이므로 다음 두 식이 성립된다.

$C$ = 1500 + 1.645 × (200/$sqrtn$)
$C$ = 1570 – 1.280 × (200/$sqrtn$)

위의 두 식은 미지수가 $n$ 과 $C$ 인 연립방정식이므로 해를 구하면 $n$ = 69.8, $C$ = 1539.4 가 된다. 즉, 표본의 크기는 대략 70이고, 선택기준은 다음과 같다.

‘$\bar{X}$ > 1539.4 이면 $H_{0}$를 기각하고, 아니면 $H_{0}$ 채택’

『eStatU』에서 ‘모평균 가설검정 : $\alpha,\beta$’를 선택하여 나타나는 <그림 7.4.1>과 같은 창에서 [$\alpha,\beta$ 가설검정 모평균]을 선택하고 $\mu_{0}=1500$, $\mu_{1}=1570$, $\alpha{=}0.05$, $\beta{=}0.10$을 입력한다.

[그림 7.4.4] 『eStatU』의 가설검정
실행 버튼을 클릭하면 <그림 7.4.5>와 같은 『eStatU』가설검정 결과가 나타나고 기준선 $C$와 표본 크기 $n$이 표시된다.

[그림 7.4.5] 『eStatU』 가설검정에서 표본 크기 결정

[예 7.4.4 풀이끝]

 

======================

연 습 문 제

7.1 모집단의 분포가 표준편차가 50인 정규분포라고 가정하자. 모집단에서 25개를 단순확률추출하여 계산한 평균이 70이다. 유의수준 0.01에서 $H_{0}:\mu{=}100$ $H_{1}:\mu\neq{100}$ 이라는 가설을 검정하고 $p$-값을 구하라.

7.2 한 볼트 제조업자는 볼트의 표준편차가 0.020 센티미터이고 평균길이가 4.5 센티미터라고 주장한다. 16개의 표본을 추출하여 4.512라는 평균을 얻었을 때 볼트의 실제 평균 길이가 제조업자의 주장과 다르다고 할 수 있나? 볼트의 길이는 정규분포를 따른다고 가정하고 유의수준은 0.01이라 하자.

7.3 고정된 양의 어떤 성분들에 증류수를 첨가한 화합물을 생산하는 공정에서 물의 필요량은 성분들의 순도에 달려있다. 제조업자의 경험으로는 정상생산을 위한 물의 필요량이 6 리터이고 표준편차가 1 리터라고 한다. 제품 9개의 표본추출로 7리터란 표본평균을 얻었다. 유의수준이 0.05일 때 제품들이 정상생산이라고 볼 수 있는가?

7.4 신체장애 근로자들에 관한 사회성 연구를 위해 장애 근로자들 모집단으로부터 20명을 단순확률추출하여 사회성을 측정한 결과가 다음과 같다.

99, 69, 91, 97, 70, 99, 72, 74, 74, 76,
96, 97, 68, 71, 99, 78, 76, 78, 83, 66.

모집단의 평균 사회성점수가 80보다 크다고 할 수 있는지 유의수준 0.05로 검정하고 $p$-값을 구하라. 단, 모집단은 표준편차 10인 정규분포를 따른다.

7.5 한 심리학자가 신체장애 근로자들에 관한 연구를 하고 있다. 이 심리학자는 과거의 경험에 의거하여 이런 장애 근로자들 모집단의 평균 사교(교제)점수가 80 보다 크다고 믿었다. 점수 모집단으로부터 고용인 20명을 표본추출하여 다음의 결과를 얻었다.

99, 69, 91, 97, 70, 99, 72, 74, 74, 76,
96, 97, 68, 71, 99, 78, 76, 78, 83, 66.

심리학자는 모집단의 평균 사교점수가 옳은지 알고 싶어한다. 모집단이 표준편차 10인 정규분포를 따를 때, 유의수준을 0.05로 하여 검정하라.

7.6 다음은 한 도매 식료품 회사의 선적부서에 일하는 고용인 중 10명을 단순임의 추출하여 얻은 몸무게이다.

154, 154, 186, 243, 159, 174, 183, 163, 192, 181.

이 자료에 근거하여 선적부서에서 일하는 고용인들의 평균 무게가 160보다 크다고 할 수 있는가? (유의수준 0.05)

모분산은 280이라고 알려졌다. 생산 감독자가 모든 근로자들의 평균 적응점수가 60보다 크다고 주장한다. 이 주장이 옳은지를 유의수준 0.05에서 검정하라. 또 $p$-값은 ?

7.8 지붕에 바르는 타르를 만드는 한 회사는 불순물의 비율이 평균 3% 가 넘지 않길 원한다. 타르 30통을 표본추출하여 불순물의 비율이 다음과 같을 때 이 자료에 의해 모평균이 3%보다 작다고 할 수 있겠는가?

3 3 1 1 0.5 2 2 4 5 4 5 3 1 3 1
4 1 1 4 2 5 3 1 1 1 0.75 1.5 3 3 2

7.9 어떤 대규모 제조업체의 미숙련근로자 40명을 단순확률추출하여 얻은 적응점수가 다음과 같다.

73 57 96 78 74 42 55 44 91 91
50 65 46 63 82 60 97 79 85 79
92 50 42 46 86 81 81 83 64 76
40 57 78 66 84 96 94 70 70 81

이 업체의 관리자는 모든 미숙련 근로자들의 평균 적응점수가 60보다 크다고 주장한다. 모분산이 280일 때, 관리자의 주장이 옳은지를 유의수준 0.05에서 검정하라. $p$-값은 얼마인가?

7.10 한 회사의 기존 타이어의 평균 수명거리는 54,000km이고, 표준편차는 10,000km이다. 두 명의 연구원이 새로운 타이어 성능시험을 독립적으로 시행하였다. 첫 번째 연구원은 25개의 타이어를 시험해서 평균 수명거리 48,000km를 얻었고, 두 번째 연구원은 100개를 시험해서 50,000km를 얻었다. 어느 실험의 결과가 새 타이어의 평균 수명거리가 기존의 것보다 작다는 보다 믿을 만한 통계적 증거를 제시하는가? 단, 표준편차는 변하지 않았다고 가정한다.

7.11 수성과 금성은 지구보다 태양에 더 가까이 있는 내혹성이다. 태양계 안의 다른 6개의 혹성은 외혹성이다. 지구의 질량을 1로 보았을 때, 두 내혹성의 평균 질량은 0.43이고 6개의 외혹성의 평균 질량은 74이다. 어느 통계학 교재에서 이 차이가 통계적으로 유의한지 여부를 검정하라고 한다. 이 검정은 과연 의미가 있는 것인가?

7.12 $n$=100, $\sigma$=8.4 가 주어졌을 때 $H_{0}:\mu{=}75.0$ 에 대해서 $HH_{1}:\mu{<}75.0$ 을 검정하고자 한다.
1) 표본평균이 73.0보다 작으면 귀무가설을 기각할 때 1종오류의 확률은?
2) $H_{1}:\mu{>}75.0$을 검정하려고 한다. 선택기준이 위와 같을 때 1종오류의 확률은?

7.13 어느 판례 연구자가 횡령죄를 선고받은 자는 평균 12.8개월을 복역한다고 주장한다. 한 법대학생이 그 주장을 검정하기 위해 재판기록에서 같은 경우의 사건60건을 뽑았다. 결과에 의하면 $\bar{x}$=11.2 이고 s=3.5 이다. 대립가설 $H_{1}:\mu\neq{12.8}$에 귀무가설 $H_{0}:\mu{=}12.8$을 유의수준 0.01로 검정하여라.

7.14 확률변량 $X$가 정규분포 $N$($\mu$, 4)를 따른다. $n$=25 이고 $\bar{x}$=0.28 일 때 유의수준 0.10으로 $H_{0}$ : $\mu$=0을 검정하여라. $\mu$의 90% 신뢰구간에 $\mu$=0이 들어가는가?

7.15 정규분포를 따르는 모집단으로부터 크기 21인 표본을 추출하여 분산 10을 얻었다. 유의수준 0.05에서 귀무가설 $\sigma^2$ = 15, 대립가설 $\sigma^2$ ≠ 15 를 검정하라.

7.16 금속 세척기의 내부 지름은 만들어지는 공정이 관리 하에 있을 때는 분산 $0.00005^2$이하를 가진다고 한다. 조립라인으로부터 표본 31개를 추출하여 분산 $0.000061^2$를 얻었다. 이 자료에 의하면 조립공정이 관리 밖에 있다고 할 수 있겠는가? 유의수준을 0.05라 하고 답을 얻기 위하여 어떤 가정이 필요한가?

7.17 어떤 제조업자가 제품을 만들려면 합성섬유의 장력강도는 분산이 5이하여야만 한다. 새 선적물로부터 25개의 표본을 추출하여 분산이 7일 때 이 자료는 제조업자가 선적을 거절하기 위한 충분한 근거를 제공하는가? 유의수준이 0.05이고 섬유의 장력강도가 근사적으로 정규분포를 따른다고 가정하자.

7.18 용기를 채우는 어떤 공정에서 평균 중량이 8g으로 조정되어 있다. 주어진 허용오차를 만족하기 위해서 중량의 표준편차는 2g이 되어야 한다. 단순확률추출한 용기 25개의 중량을 측정하여 2.8g의 표준편차를 얻었다.
1) 중량이 정규분포를 따른다고 가정할 때 모분산이 규정된 값보다 크다고 할 수 있는가? 유의수준 0.01에서 검정하라.
2) 귀무가설을 기각할 수 없는 표본분산의 범위는? 이 값들은 규정된 값 2g에 대하여 대칭인가? 그 이유는 무엇인가?

7.19 특정 상표의 공업용 줄 16개를 단순확률추출하여 인장강도를 측정한 결과 표본분산이 140이었다. 이 결과는 모분산이 125 이하라는 제조회사의 주장을 반박할 근거가 될 수 있는가? 유의수준 5%에서 검정하라.

7.20 학생수가 10,000명인 어떤 대학에서 학생용 주차장을 만들려고 한다. 학교 당국은 학생의 20% 이상이 자동차로 등교한다고 생각한다. 만약 250명을 추출하여 65명이 자동차 등교를 한다고 나왔다면 학교 당국의 생각이 옳다고 할 수 있는지를 유의수준 0.05에서 검정하라.

7.21 어떤 회사의 담당회계사는 경비명세서의 20% 이상이 적어도 하나의 실수를 포함한다고 생각한다. 만약 400개의 명세서를 추출하여 100개에서 하나 이상의 실수를 발견했다면 회계사의 생각이 옳다고 할 수 있는지를 검정하라. 유의수준은 0.05이다.

7.22 작년에 전업한 200명의 회사원을 만나보았다. 그 중 30명이 그들이 전업한 이유를 직장에서 승진에 대한 큰 전망을 기대할 수 없었기 때문이라고 진술했다. 이 자료로부터 같은 이유로 작년에 전업한 회사원이 전체의 20%보다 적다고 할 수 있는가? 유의수준은 0.05이다.

7.23 유명한 통계학자인 칼 피어슨(Karl Pearson)이 동전을 24,000번 던졌더니 앞면이 12012번, 뒷면이 11988번 나왔다. 이 자료는 앞면이 나올 확률이 0.5라는 귀무가설을 뒷받침하는가? 유의수준 0.05에서 검정하라.

7.24 한 과학자가 주장하기를 시계를 착용하면 사람이 약해진다고 한다. 그의 주장을 검정하려고 10명에게 시계를 찼을 때와 안 찼을 때의 힘을 측정하였다. 힘의 차이가 시계의 착용여부와는 무관하다면 10명 중 7명이 시계를 착용했을 때 힘이 감소할 확률은 얼마인가? 최소 7명의 힘이 감소한다면 그의 이론을 받아들인다고 하자. 이때의 1종오류의 확률을 구하라. (귀무가설과 대립가설을 명시하라.)

7.25 어떤 교수가 성적처리에 편리한 OX시험을 본다. 그는 오랜 경력을 통해서 8,000개의 문제 은행을 갖고 있는데 매 시험마다 문제를 단순확률추출하여 출제한다. 이 교수는 8,000문제 중 70%를 맞출 수 있는 학생을 통과시키고자 한다. 만약 시험이 100문제일 때, 8,000문제 중 70%의 정답을 맞출 수 있는 학생의 99%가 통과되기 원한다면 이 교수는 통과점수를 얼마로 해야 하는가? 이렇게 통과점수를 정했을 때 8,000문제 중 60%를 아는 학생이 시험을 통과할 확률은 얼마인가?

7.26 한 고등학생이 나무로 주사위를 만들었다. 정육면체가 아닌 것처럼 보여 6이 나올 확률이 1/6이 아니라고 주장한다. 이 주사위를 18,000번 굴렸더니 6이 3,126번 나왔다.
1) 이 126번의 차이가 통계적으로 유의한 것인가를 $p$-값을 구하여 판단하라.
2) 손으로 만든 주사위인데 6이 나올 확률이 정확히 1/6이기를 요구하는 것은 무리라고 생각해서, 1/6에서 0.01 정도의 오차는 허용하기로 했다. 18,000번 던진 결과로부터 6이 나올 확률에 대한 신뢰구간을 구하여 실용적인 의미에서 공정한 주사위로 보아도 무방한지 판단하여라. (참고: 이 예에서와 같이 통계적 유의성(statistical significance)과 실용적 유의성(practical significance)을 구분하여야 한다. 특히 대표본일 때 통계적으로 유의하다고 해서 반드시 실용적인 의미가 있는 것은 아니다. 가설검정에만 의존하면 통계적 유의성과 실용적 유의성을 구별하기 어려운데, 이 때 신뢰구간을 구해보면 실용적 유의성을 판단하는 데에 도움이 된다.)

7.27 어떤 사람이 동전던지기의 결과를 예측하는 능력이 있는지 여부를 통계적으로 판단하려고 한다. 동전을 10번 던지는 실험에서 1종오류의 확률이 5%가 넘지 않게 하기 위해서는 이 사람이 적어도 몇 번의 결과를 정확히 예측해야만 한다고 기준을 정해야 하는가? 이 사람이 첫 시험을 통과하기에 충분한 정확한 예측을 못했다면 그 결과는 버리고 다시 동전을 10번 던져 그 결과를 사용하기로 결정했다. 이 사람이 실제로 예측능력이 없음에도 불구하고,
1) 이 사람이 첫 시험에 통과할 확률은?
2) 첫 시험에 실패하고 두 번째 시험에 통과할 확률은?
3) 두 시험에 계속 실패하고 세 번째 시험에 통과할 확률은?
4) 몇 번째이든 관계없이 결국 시험을 통과할 확률은?

7.28 A상자에는 빨간 공 100개와 하얀 공 200개가 있고, B상자에는 빨간 공 200개와 하얀 공 100개가 있다. $P$ 는 상자에서 꺼낸 공이 빨간 공일 확률이다. 어느 상자로부터 추출되었는지 모르기 때문에 $P$를 모른다. $H_{0}:P=1/3$, $H_{1}:P=2/3$ 을 검정하기 위해 선택된 상자로부터 복원추출로 3개의 공을 꺼낸다. $X$는 추출한 빨간 공의 수이다. 기각역을 {$X$ ≥ 2}로 정했을 때 1종오류와 2종오류의 확률을 각각 구하라.

** 다음의 각 상황에 대한 검정력 함수를 구하고 그래프를 그려라.
7.29 $H_{0}:\mu{=}51$, $H_{1}:\mu{<}51$, $n$ = 25, σ = 3, α = 0.05.
7.30 $H_{0}:\mu{=}516$, $H_{1}:\mu{>}516$, $n$ = 16, σ = 32, α = 0.05.
7.31 $H_{0}:\mu{=}3$, $H_{1}:\mu\neq{3}$, $n$ = 100, σ = 1, α = 0.05.
7.32 $H_{0}:\mu{=}4.25$, $H_{1}:\mu{>}4.25$, $n$ = 81 , σ= 1.8 , α = 0.01.

7.33 연습문제 7.30에서 β = 0.10 , $\mu_{1}$ = 520 일 때 $n$ 과 $C$ 를 구하고 선택기준을 말하라.

7.34 연습문제 7.31에서 β = 0.05 , $\mu_{1}$ =4.52 일 때 $n$과 $C$ 를 구하고 선택기준을 말하라.

7.35 연습문제 7.32에서 β = 0.03 , $\mu_{1}$ =5.00 일 때 $n$과 $C$ 를 구하고 선택기준을 말하라.

7.36 어느 공장에서 만드는 전열선의 저항의 표준편차는 0.02Ω으로 알려져 있다. 어느 전자회사에서 이 전선의 평균저항이 0.4Ω 보다 크다는 충분한 증거가 있으면 전열선을 구입하고 아니면 구입하지 않기로 하였다. 이 회사의 경영진에서는 통계적 검정에서 유의수준 $\alpha=0.05$ 와 표본크기 $n=100$ 의 정책을 고수하고 있다.
1) 적당한 귀무가설과 대립가설을 기술하라.
2) 1종오류와 2종오류를 기술하라.
3) 검정의 기각역을 구하라.
4) 검정력 함수와 OC곡선을 그려라.

7.37 동전이 공정한가를 검정하기 위해서 다음과 같은 결정기준이 정해졌다.
① 동전을 100번 던져서 나온 앞의 횟수가 40부터 60까지에 포함되면 귀무가설을 채택한다.
② 그 밖의 경우에는 귀무가설을 기각한다.
1) 귀무가설과 대립가설은 무엇인가?
2) 이 검정의 1종오류의 확률은?
3) 이 검정의 임계값(critical value)을 표준정규분포의 $Z$값으로 표시하라.
4) $p=$0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 일 때 2종오류의 확률을 구하라.

======================
연 습 문 제 (객관식 문제)

7.1 1종오류란 어느 것인가?
(정답 ①)
① 귀무가설이 옳은 데도 기각하는 오류
② 귀무가설이 옳은 데도 옳다고 하는 오류
③ 귀무가설이 옳지 않은 데도 기각되는 오류
④ 귀무가설이 옳지 않은 데도 옳다고 하는 오류

7.2 귀무가설이 기각될 때 대신 받아들이려는 가설은?
(정답 ③)
① 귀무가설
③ 대립가설

7.3 다음 중 옳은 설명은?
(정답 ②)
① 통계적 가설에 대한 결론은 항상 절대적이다.
② 귀무가설이 기각된다는 것은 대립가설을 채택한다는 뜻이다.
③ 1종오류를 줄이기 위해서는 유의수준 0.01보다는 0.05를 채택하는 것이 좋다.
④ 2종오류를 줄이기 위해서는 유의수준 0.05보다는 0.01을 채택하는 것이 좋다.

7.4 유의수준 $\alpha{=}0.05$의 의미는?
(정답 ①)
① 동일한 검정법을 여러 번 반복하여 사용할 때 잘못으로 귀무가설 $H_{0}$를 기각하게 될 경우가 전체의 5% 이하일 것이라는 뜻이다.
② 대립가설이 기각될 확률이 0.05라는 뜻이다.
③ 대립가설이 귀무가설보다 채택될 확률이 0.05가 된다는 뜻이다.
④ 2종오류를 허용하는 확률 범위가 5% 이하라는 뜻이다.

7.5 표준정규분포를 이용하는 모평균의 우측검정에서 유의수준 5%일 때 검정통계량의 기각 기준선은 얼마인가?
(정답 ②)
① 2.58

7.6 귀무가설 $H_{0}:\mu{=}\mu_{0}$일 때 양측검정의 대립가설은?
(정답 ④)
① $H_{1}:\mu{>}\mu_{0}$ ②$H_{1}:\mu{<}\mu_{0}$
③ $H_{1}:\mu{=}\mu_{0}$ ④$H_{1}:\mu\ne\mu_{0}$

7.7 다음은 통계적 가설검정의 순서를 나열한 것이다. 올바른 순서는?
(정답 ②)
a. 가설을 설정한다.
b. 유의수준을 결정한다.
c. 가설의 채택 여부를 결정한다.
d. 검정통계량을 계산한다.
e. 기각역을 구한다.

① a→d→e→b→c
② a→d→b→e→c
③ b→e→d→a→c
④ a→c→b→d→e

7.8 다음 설명 중 틀린 것은?
(정답 ③)
① 귀무가설이 기각된다는 것은 대립가설을 채택한다는 뜻이다.
② 1종오류를 범할 확률의 최대허용한계를 유의수준이라고 한다.
③ 귀무가설이 거짓일 때 귀무가설을 채택하는 오류를 1종오류라고 한다.
④ 대립가설이 옳은데도 귀무가설을 채택하는 오류를 2종오류라고 한다.

7.9 귀무가설 $\mathrm{H_{0}}:\sigma^2=\sigma_{0}^2$일 때 양측검정의 선택기준은?
(정답 ④)
① $\frac{(n-1)S^{2}}{\sigma_{0}^{2}}>\chi_{n-1,\alpha{}}^{2}$ 이면 $\mathrm{H_{0}}$ 기각,
② $\frac{(n-1)S^{2}}{\sigma_{0}^{2}}<\chi_{n-1,\alpha{}}^{2}$ 이면 $\mathrm{H_{0}}$ 기각,
③ $\frac{(n-1)S^{2}}{\sigma_{0}^{2}}>\chi_{n-1,\alpha{/2}}^{2}$ $\mathrm{H_{0}}$ 기각,
④ $\frac{(n-1)S^{2}}{\sigma_{0}^{2}}>\chi_{n-1,\alpha{/2}}^{2}$ 또는$\frac{(n-1)S^{2}}{\sigma_{0}^{2}}<\chi_{n-1,1-\alpha{/2}}^{2}$ 이면 $\mathrm{H}_{0}$ 기각

7.10 한 동전이 정상적인지 검정하기 위해 동전을 10,000번 던졌더니 앞면이 5020번, 뒷면이 4980번 나왔다. 검정하고자하는 가설은?
(정답 ③)
① $H_{0}:\mu{=}10000$ ②$H_{0}:\mu{>}5000$
③ $H_{0}:p>0.5$ ④$H_{0}:p≠0.5$

7.11 가설검정의 검정력이란?
(정답 ④)
① $\alpha$ ②$\alpha$
③ $\beta$ ④$\beta$

7.12 가설검정의 운영특성함수란?
(정답 ②)
① $\alpha$ ②$\alpha$
③ $\beta$ ④$\beta$

Leave a Reply

Your email address will not be published. Required fields are marked *