예 10.1.1

[예 10.1.1] 어느 과자제품의 겉봉지에 용량이 200g이라 표시되어 있다. 여러 소매점에서 이 과자 10개를 구입하여 무게를 조사하니 다음과 같다.

203 204 197 195 201 205 198 199 194 207

과연 표시된 용량만큼 과자가 들어있다고 할 수 있는가?

1) 모수적 방법으로 가설검정을 할 수 있는지 데이터의 히스토그램을 그려보라.

2) 부호를 이용하는 비모수적 방법으로 가설검정을 하라. 유의수준 5%.

3)『eStatU』를 이용하여 위의 부호검정 결과를 확인하라.

<풀이>

1) 이 문제에 대해서는 다음과 같이 모평균()에 대한 두 개의 가설을 세울 수 있다.

표본이 10개인 소표본이라 모수적 방법으로 가설을 검정하기 위해서는 모집단이 정규분포라는 가정이 필요하다. 과연 표본 데이터가 이러한 가정을 만족하는지 살펴보기 위하여 『eStat』에 <그림 10.1.1>과 같이 데이터를 입력한다.

[그림 10.1.1] 과자 무게 데이터 입력

모평균 가설검정 아이콘 을 클릭하여 나타나는 변량선택박스에서 ‘분석변량’을 무게를 선택하면 평균-신뢰구간 점그래프가 나타난다(<그림 10.1.2>). 다시 그래프 밑의 선택사항에서 ‘히스토그램’ 버튼을 누르면 <그림 10.1.3>과 같은 히스토그램이 나타난다. 히스토그램을 살펴보면 데이터의 수가 작아서 모집단이 정규분포를 따른다고 가정하기에는 충분치 못하다. 이러한 경우 모수적 가설검정인 검정을 적용하면 오류를 범할 수 있다.

2) 이와 같은 경우 표본 데이터를 과자 용량 200g 보다 큰지(표시) 아닌지(표시)만 조사하여 다음과 같이 부호 데이터로 변환할 수 있다.

표본 데이터

203

204

197

195

201

205

198

199

194

207

부호 데이터

만일 의 개수와 의 개수가 비슷하다면 대략 과자 용량 200g이 맞을 것이다. 만일 의 개수가 더 많다면 200g보다 큰 것을 의미하고, 의 개수가 더 많다면 200g보다 작은 것을 의미하게 된다.

위의 부호 데이터는 200보다 크고 작은 것만을 조사하기 때문에 평균이라는 개념은 사용하지 않아 이 문제에 대해서는 다음과 같이 모집단 중앙값()에 대한 두개의 가설을 설정하는 것이 좋다.

위의 부호 데이터에서 (또는 )는 , 인 이항분포(<그림 10.1.4>)를 따른다.

<그림 10.1.4> , 인 이항분포

따라서 가 맞다면 부호의 개수는 5가 제일 많이 나타날 수 있고 0, 1 또는 9, 10은 나타날 확률이 매우 적다. 유의수준 5%로 귀무가설 의 양측검정 기각역은 분포 양쪽 끝의 확률이 2.5%가 되어야 하므로 대략 다음과 같다.

만일 가 0 또는 1 이거나 (왼쪽 누적확률 0.011), 9 또는 10 이면 (오른쪽 누적확률 0.011) 기각

이 기각역은 유의수준이 이므로 주어진 유의수준 0.05보다 작은 기각역이다. 이산형 분포인 이항분포를 이용하기 때문에 유의수준 5%와 정확하게 일치하는 기각역을 찾을 수 없는 경우가 많다. 한 값 안쪽으로 기각역을 설정하면

만일 이거나 (왼쪽 누적확률 0.055), 이면 (오른쪽 누적확률 0.055) 기각

이 기각역은 유의수준이 인 기각역이다. 그래서 경계선에 있는 값의 중간값 1.5나 8.5를 기준선으로 이용할 수도 있다.

만일 이거나, 이면 기각

이 방법도 근사적인 것이어서 이산형 분포인 경우 두 기각역 중에서 ‘어떤 것이 맞다’라고 할 수는 없고 분석자가 유의수준 근처에서 기준선을 선택하여야 한다. 이 예의 경우에는 어느 기각역이라도 가 5이므로 는 기각할 수 없다. 즉, 과자 용량의 중앙값은 200g이라 할 수 있다.

3)『eStatU』에서 <그림 10.1.5>와 같이 데이터를 입력한 후 ‘실행’ 버튼을 누르면 <그림 10.1.6>과 같은 검정결과를 보여준다. 여기서는 유의수준 5%(양측검정의 경우 2.5%)가 포함되는 값의 기준선을 표시하여 준다. 이산형 분포의 경우 최종 기각역의 선택은 분석자가 결정하여야 한다.

Leave a Reply

Your email address will not be published. Required fields are marked *