3.3 두 연속형 변량 데이터의 시각화

일반적으로 한 관찰대상에 대해 데이터를 수집할 경우 하나 이상의 변량에 대한 정보를 수집한다. 예를 들어 한 초등학교 학생에 대해서는 성별과 함께 신장 및 체중을 같이 조사할 수 있다. 즉 한 개의 범주형 변량과 두 연속형 변량을 측정하는 경우이다.

이와 같이 두 개의 연속형 변량을 측정한 데이터는 산점도(scatter plot)를 이용하여 두 변량의 관련성 등을 분석할 수 있다. 산점도는 한 변량의 값을 x축, 다른 변량의 값을 y축으로 하여 2차원 평면위에 각각의 데이터를 표시한 것이다. 만일 성별과 같은 범주형 변량을 같이 측정하여 그룹으로 하였다면 각 그룹의 색을 구분하여 산점도를 그릴 수 있다.

두 연속형 변량에 대한 상관 및 회귀분석은 11장에서 자세히 살펴 본다.

[예 3.3.1] (신장 및 체중 – 두 연속형 변량)

한 초등학교 학급 10명의 성별, 신장, 체중을 조사한 데이터가 아이콘 EX > 40연속_성별신장체중.csv에 저장되어 있다.『eStat』을 이용하여 신장과 체중의 산점도를 그려라.

2015년 시도별 남녀 인구수

번호 성별 신장 체중
1 1 150 45
2 2 147 47
3 1 145 44
4 2 151 50
5 1 149 48
6 2 148 47
7 1 155 51
8 2 156 50
9 1 161 55
10 2 159 56

‘Ex’ 아이콘 폴더의 ’40연속_성별신장체중.csv’

eStat 그래프

(풀이)

‘eStat 그래프’ 버튼을 클릭하면 신장과 체중의 산점도가 나타난다.

이 산점도에서는 회귀선을 체크해서 같이 관찰 할 수 있다, 산점도를 살펴보면 신장이 클수록 체중도 상대적으로 많이 나가는 것을 관찰할 수 있다.

(『eStat』에서 데이터 처리 방법)

아이콘 EX > 40연속_성별신장체중.csv를 불러온다.

마우스로 ‘신장’과 ‘체중’을 클릭한후 산점도 아이콘 을 클릭하면 <그림>과 같은 신장을 x축 (첫번째 선택된 변량), 체중을 y축 (두번째 선택된 변량)으로 한 산점도가 그려진다.

성별로 그룹이 표시된 산점도를 그리려면 시트에서 ‘성별’, ‘신장’, ‘체중’ 변량을 차례로 선택한 후 아이콘 을 클릭하면 <그림>와 같이 성별로 색이 다르게 표시된 산점도가 나타난다. 회귀선을 체크하면 각 그룹별 회귀선이 표시된다.

 

[실습 3.3.1]

성별(1:남자, 2:여자)에 따른 나이와 월수입 조사 데이터가 아이콘 EX > 41연속_나이월수입조사.csv에 저장되어 있다. 나이와 월수입의 산점도를 그려라. 성별에 따른 나이와 월수입의 산점도를 그려보라.

점그래프

히스토그램

줄기와 잎 그림

 양쪽형 줄기

(점그래프) 평균 표준편차      

(히스토그램) 평균 도수 도수분포다각형  

 구간시작   구간너비

(산점도) 회귀선

 

Leave a Reply

Your email address will not be published. Required fields are marked *