예 11.1.1

[예 11.1.1] 어느 지방선거 전에 세 후보자의 지지도를 알아보기 위해 150명을 표본추출하여 조사한 결과가 다음과 같다.

후보자명 지지자수 백분율
60 명 40.00%
50 명 33.30%
40 명 25.70%
합계 150명 100%

이 표본자료만 본다면 ‘갑’ 후보가 40% 지지율로 타 후보들보다 지지율이 높은 것 같다. 과연 이 표본자료의 결과를 가지고 후보의 지지율이 다르다고 볼 수 있는가? 유의수준 5%로 검정하라. 『eStatU』를 이용하여 적합성검정을 하라.

<풀이>

각 후보의 지지율을 $p_{1},p_{2},p_{3}$라 할때 위 문제에 대한 가설은 다음과 같다.

$H_{0}$ : 세 후보의 지지율이 같다. (즉, $H_{0}:\textit{p}_{1}=p_{2}=p_{3}=\frac{1}{3}$)
$H_{1}$ : 세 후보의 지지율이 다르다.

만일에 ‘세 후보의 지지율이 같다’는 귀무가설 $H_{0}$가 맞다면 150명의 표본에 대해 각 후보가 기대할 수 있는 지지자 수는 각각 $50(=150/3)$명일 것이다. 이것을 기대도수(expected frequency)라 한다. 각 후보별로 표본에서 관찰된 지지자 수를 관찰도수(observed frequency)라 부르는데 $H_{0}$가 사실일 경우의 기대되는 지지자 수를 정리하면 아래와 같다.

만일에 $H_{0}$가 사실이라면 관찰된 지지자 수($O_{i}$)와 기대되는 지지자 수($E_{i}$)는 일치할 것이다. 그래서 위의 가설을 검정하는 통계량은 $O_{i}$와 $E_{i}$ 의 차이값을 이용한다. 구체적으로 위의 가설에 대한 검정통계량은 다음과 같다.


이 검정통계량의 관찰된 값이 0에 가까우면 $O_{i}$와 $E_{i}$가 근접하게 되므로 $H_{0}$가 사실이라고 볼 수 있고, 값이 커지면 $H_{0}$를 기각하여야 될 것이다. ‘관찰된 값이 얼마나 커지면 통계적으로 유의하는지?’가 문제인데 기대도수가 충분히 클 경우 이 검정통계량은 근사적으로 카이제곱 분포를 따르게 된다. 따라서 가설의 선택기준은 다음과 같다.

‘$\chi_{obs}^{2}>\chi_{k-1;\alpha{}}^{2}$이면 $H_{0}$ 기각, 아니면 $H_{0}$ 채택’

여기서 $k$는 도수분포의 범주의 개수이다. 위의 예제에서

$\chi_{obs}^{2}=\frac{(60-50)^{2}}{50}+\frac{(50-50)^{2}}{50}+\frac{(40-50)^{2}}{50}=4$

이고, 유의수준 $alpha$가 5%이므로

$\chi_{k-1;\alpha{}}^{2}=\chi_{3-1;0.05}^{2}=\chi_{2;0.05}^{2}=5.991$

이다. 따라서 $H_{0}$는 기각하지 못한다. 즉, 위의 표본자료는 세 후보의 지지율이 차이가 나지만 이 정도의 차이로는 세 후보의 지지율이 다르다고 결론지을 수 있는 충분한 근거가 되지 못한다는 것이다.
각 후보의 표본 지지율 ${\widehat{p}}_{1}=\frac{60}{150}=0.40$, ${\widehat{p}}_{2}=\frac{50}{150}=0.33$, ${\widehat{p}}_{3}=\frac{40}{150}=0.27$을 이용하여 6장의 모비율 구간추정 이론으로 각 후보의 지지율에 대한 95% 신뢰구간 $\left({\hat{p}\pm{1}{.}{96}\sqrt{\hat{p}\left({{1}{-}\hat{p}}\right){/}{n}}}\right)$을 구하면 다음과 같다.

갑 : $0.40\pm{1.96}\sqrt{\frac{0.40CDOT0.60}{150}}\Leftrightarrow{[0.322,}0.478]$
을 : $0.33\pm{1.96}\sqrt{\frac{0.33CDOT0.67}{150}}\Leftrightarrow{[0.255,}0.405]$
병 : $0.27\pm{1.96}\sqrt{\frac{0.27CDOT0.73}{150}}\Leftrightarrow{[0.190,}0.330]$

이 세 후보의 지지율에 대해 추정된 구간이 서로 겹친다는 것은, 한 후보의 지지율이 다른 후보들보다 완전히 다르다고 볼 수는 없다는 것이다.
『eStatU』의 ‘적합성검정’ 메뉴를 선택하여 나타나는 입력박스에 <그림 11.1.1>과 같이 ‘관찰도수’와 ‘기대확률’ 데이터를 입력한다. 데이터 입력이 끝난 후 유의수준을 선택하고 ‘실행’ 버튼을 누르면 ‘기대도수’가 계산되고 카이제곱 검정 결과가 계산된다. 카이제곱분포를 이용한 검정은 기대도수가 적어도 5이상이 될 때 적용하여야 한다.

[그림 11.1.1] 『eStatU』데이터 입력
[그림 11.1.2] 『eStatU』카이제곱 검정

[예 11.1.1 풀이 끝]

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다