Category Archives: 2장 2-1 예제 및 풀이

예제 2.2.1

(우리나라 시도별 인구 – 한 그룹 요약 데이터)

2015년 우리나라의 17개 시도별 인구가 표 2.2.2와 같다. 이 데이터는 『eStat』에서 아이콘 ⇨ 01Korean ⇨ 023요약_2015년남녀별인구.csv에 저장되어 있다. 『eStat』을 이용하여 막대그래프, 원그래프, 띠그래프, 꺾은선그래프를 그려 그 특징을 알아보자.

표 2.2.2 시도별 인구수 (출처: 통계청 단위: 만명)
시도 인구수
서울 990
부산 345
대구 247
인천 289
광주 150
대전 154
울산 117
세종 20
경기 1248
강원 152
충북 159
충남 211
전북 183
전남 180
경북 268
경남 333
제주 61

풀이 2.2.1

<풀이>

『eStat』시스템에서 ⇨ 01Korean ⇨ 023요약_2015년남녀별인구.csv를 선택하고 마우스로 첫째 변량 ‘시도’와 둘째 변량 ‘인구수’ 변량명을 차례로 클릭하여 변량을 선택한다. 선택된 변량은 시트 위의 ‘선택변량’ 박스에 나타난다. <그림 2.1>과 같이 변량선택박스에서 ‘분석변량’ ‘by 그룹’ 박스에서 선택하여도 ‘선택변량’ 박스에 동일한 결과가 나타난다.

<그림 2.2.1> 데이터의 변량선택박스

변량이 선택되면 기본 그래프인 <그림 2.2-1>과 같은 시도별 인구의 수직형 막대그래프가 그려진다. 막대그래프를 보면 경기도와 서울시의 인구가 압도적으로 많음을 볼 수 있다. 그래프 밑의 선택사항에서 내림차순을 이용하면 <그림 2.2.2-2>와 같이 인구의 내림차순으로 막대가 정렬되어 나타난다. 경기, 서울 다음으로는 부산 경남 인천 순서임을 잘 살펴볼 수 있다.

<그림 2.2.2-1> 시도별 인구 – 수직형 막대그래프 <그림 2.2.2-2> 시도별 인구 – 내림차순 정렬 막대그래프

막대그래프는 막대를 위아래로 그리는 수직형이 일반적이나, 범주의 개수가 많은 경우 왼쪽/오른쪽으로 그리는 수평형 형태의 막대그래프가 이용된다. 『eStat』에서 을 클릭하면 <그림 2.2-3>의 좌측 하단과 같은 수평형 막대그래프가 나타난다. 이때 도수표시 버튼을 클릭하면 각 막대의 빈도수가 표시된다(<그림 2.2.2-4>).

<그림 2.2.2-3> 시도별 인구 – 수평형 막대그래프 <그림 2.2.2-4> 시도별 인구 – 도수표시된 수평형 막대그래프

『eStat』에서 클릭하면 시도별 원그래프가 나타난다(<그림 2.3>). 원그래프를 보면 서울과 경기 인천의 인구수가 전체 인구의 50% 가까운 수도권 집중현상을 쉽게 관찰할 수 있다. 『eStat』에서 을 클릭하면 원그래프에서 가운데 작은 원을 잘라낸 도넛그래프(doughnut graph)가 나타난다.

<그림 2.2.3> 시도별 인구의 원그래프

『eStat』에서 클릭하면 띠그래프가 나타난다(<그림 2.4>). 띠그래프는 원그래프의 변형 형태로 각 범주의 값이 전체 데이터 중에서 차지하는 비율을 사각형 조각으로 나누어 표시한 그래프이다. 범주의 값이 큰 순서부터 정렬할 수도 있으나 원그래프와 구별하기 위하여 『eStat』에서는 데이터의 범주 순서대로 사각형 조각을 그렸다. 여러 개 붙여놓은 사각형이 띠 같아 띠그래프라고 부른다.

<그림 2.2.4> 시도별 인구의 띠그래프

『eStat』에서 을 클릭하면 꺾은선그래프(line graph)가 나타난다(<그림 2.5>). 범주형 데이터의 각 범주의 값을 X값, 그룹 변량의 값을 Y값으로 하여 XY평면에 점으로 표시한 후 이를 선으로 연결한 것이다. 위와 같은 인구 데이터의 경우에는 막대그래프와 유사하나, 연도별 수출액/수입액 등 시간에 관련되어 수집된 데이터의 경우에는 시간에 따른 데이터의 변화를 관찰할 수 있어 많이 이용된다.

<그림 2.2.5> 시도별 인구의 꺾은선그래프