3강 Classification in High Dimensional Data

 

설명

· 나무구조모형은 유전체자료의 모형화 방법으로 개체간의 관련성을 고려한 hidden structure를 찾아 이해하기 쉬운 나무 재질의 모형을 제시하여 비통계인이 이해하기 쉬운 방법이다.

· 분류를 위한 나무모형은 1984년 Freedman에 의한 CART모형을 출발로 FACT, QUAID등이 발표되었다. 자료의 반응변수가 생존기간과 같은 연속형인 경우 STUDI를 이용하여 Survival Tree를 구하여 생존군을 군집화한 나무모형을 얻을 수 있다.

· 나무구조 생존모형을 분석해나가는 과정과 그의 해석으로 나무모형을 구축하는 알고리즘의 변수 선별 기준 등을 설명한다.

 

강사소개

강의자 : 이태림

· 서울대학교 간호학과 졸업

· 서울대학교 보건대학원(보건통계학 석사)

· 서울대학교 계산통계학과(이학사, 이학석사)

· 중앙대학교 대학원 응용통계학과(통계학박사)

· 미국 노스캐롤라이나대학교 Post Dr.

· 현재: 한국방송통신대학교 정보통계학과 교수

 

과목소개

· 건강빅데이터 시대의 후기 유전체 시대를 주도할 학문으로서 바이오정보학의 현황과 구체적인 유전체 연구 방법론을 소개한다.

· 유의한 유전체 탐색을 위한 통계적 방법으로 군집분석과 분류모형, 연과성을 기초로한 Penalized logit model, SNS 분석방법인 Network Analysis를 유전체 자료에 적용한다.

· 유의한 Biomarker를 찾는 FWER과 FDR 방법을 소개하고 유전자료를 이용한 예측과 예측모형의 평가 및 이를 이용한 치료 이해, 태아의 선천성기형이나 암을 조기진단하는 방법과 유전체 자료의 시각화 방법인 Matrix Visualization의 방법을 설명한다.