2강 Clustering in Health Big Data

 

설명

· 군집분석은 유전체자료의 탐색적 자료분석 방법으로 개체간의 유사성을 정의하여 유사성이 높은 자료들끼리 묶어서 군집cluster를 이루어 나가는 통계적 방법이다.

· 각 개체가 속하는 범주에 대한 사전지식이 없이 군집을 형성해나가기 때문에 유사성similarity의 정의와 기준에 따라 다른 군집결과를 얻을 수 있다.

· 유전체 연구에 있어서는 대규모의 유전체 전체에 대한 발현형태를 밝힐 수 있다. 즉 암질환에 영향을 주는 유전자를 규명하고자 할 때 같은 특성을 갖는 유전체끼리 또는 비슷한 특성을 갖는 환자표본들끼리 함께 군집으로 묶어 세부 진단군을 규명하거나 암질환에 영향을 주는 유전체군을 찾을 때에도 활용할 수 있는 유용한 통계분석 방법이다.

 

강사소개

강의자 : 이태림

· 서울대학교 간호학과 졸업

· 서울대학교 보건대학원(보건통계학 석사)

· 서울대학교 계산통계학과(이학사, 이학석사)

· 중앙대학교 대학원 응용통계학과(통계학박사)

· 미국 노스캐롤라이나대학교 Post Dr.

· 현재: 한국방송통신대학교 정보통계학과 교수

 

과목소개

· 건강빅데이터 시대의 후기 유전체 시대를 주도할 학문으로서 바이오정보학의 현황과 구체적인 유전체 연구 방법론을 소개한다.

· 유의한 유전체 탐색을 위한 통계적 방법으로 군집분석과 분류모형, 연과성을 기초로한 Penalized logit model, SNS 분석방법인 Network Analysis를 유전체 자료에 적용한다.

· 유의한 Biomarker를 찾는 FWER과 FDR 방법을 소개하고 유전자료를 이용한 예측과 예측모형의 평가 및 이를 이용한 치료 이해, 태아의 선천성기형이나 암을 조기진단하는 방법과 유전체 자료의 시각화 방법인 Matrix Visualization의 방법을 설명한다.