2.1 범주형 데이터시각화를 위한 그래프

– 한 학급의 남녀 학생이 몇 명인지 또는 한 회사의 사원 중에서 미혼자와 기혼자가 몇 명인지 등을 조사한 데이터를 범주형 데이터라 한다. 범주형 데이터 시각화에는 막대그래프, 원그래프, 띠그래프, 꺽은선그래프 등이 이용된다.

– 막대그래프(bar graph)는 각 범주별 데이터 값의 크기를 알아볼 수 있도록 각 범주의 값을 막대의 높이로 나타낸 것이다. 범주형 데이터라는 것을 강조하기 위하여 막대사이의 간격을 띄어 놓는다. 일반적으로 막대를 상하로 그리는 세로형 막대그래프가 많이 이용되나 데이터에 따라서는 막대를 좌우로 그리는 가로형 막대그래프가 이용되기도 한다.

– 그룹별 범주형 데이터에 대한 막대그래프를 경우 각 그룹별 막대그래프를 그리든가(분리형), 한 그룹의 막대위에 다른 그룹의 막대를 올려놓는 쌓는형, 전체 그룹의 데이터에 대한 각 그룹의 비율로 막대를 분할해서 그리는 비율형, 각 그룹의 막대를 비교하기 좋게 옆으로 위치해 놓는 나란형, 그룹이 두 개일 경우 막대를 좌우로 그리는 양쪽형 등 다양한 변형 형태가 있다.

– 원그래프(pie chart)는 각 범주의 값이 전체 데이터 중에서 차지하는 비율을 원조각으로 나누어 표시한 그래프이다. 비율의 비교를 잘 할 수 있도록 시계 방향으로 가장 큰 범주의 원조각부터 순서대로 차례로 그린다.

– 띠그래프(band graph)는 원그래프의 변형 형태로서 각 범주의 값이 전체 데이터 중에서 차지하는 비율을 사각형 조각으로 나누어 표시한 그래프이다. 가장 범주의 값이 큰 순서부터 정렬할 수도 있으나 원그래프와 구별하기 위하여 데이터의 범주 순서대로 사각형 조각을 그린다.

– 꺽은선그래프(line graph)는 범주형 데이터의 각 범주의 값, 즉 여기서는 각 범주를 X값(편의상 1,2, … 범주의 개수), 범주의 값을 Y값으로 하여 XY평면에 점으로 표시한 후 이를 선으로 연결한 것이다. 막대그래프와 유사하나, 연도별 수출액 등의 경우에는 시간에 따른 데이터의 변화를 관찰할 수 있다.

– 이 장에서는 범주형 데이터를 요약 데이터와 원시 데이터로 구분하여 어떻게 『eStat』으로 위와 같은 그래프를 이용하여 시각화를 할 수 있는지 살펴본다.

Leave a Reply

Your email address will not be published. Required fields are marked *

CAPTCHA