9강 유전체 분류와 군집분석

 

설명

· 최첨단의 획기적인 기술 발달로 수십만 내지 수백만 개의 유전체 자료를 단시간 내에 관측 가능하게 됨에 따라, 수많은 유전체 자료로부터 유용한 정보를 추출하여 유전체 정보와 질환과의 연관성을 밝혀내는 통계적인 방법 개발이 매우 중요하게 되었다. 분류 분석은 많은 수의 유전체 자료로부터 질환 여부를 분류할 수 있는 소수의 후보 유전자를 찾아 새로운 개체에 대하여 질환 여부를 판단하고자 하는 통계적인 방법이다. 군집분석은 수많은 유전자의 패턴과 상관성을 파악하여 비슷한 정보나 패턴 양식을 갖는 각각의 유전자들을 군집으로 묶어주는 통계적인 방법이다. 분류 분석과 군집분석은 유전자를 분류하고 그룹화한다는 점에서 유사하나, 분류 분석은 새로운 개체를 미리 정해진 특정그룹으로 분류하는 것이고 군집분석은 그룹에 대하여 사전에 아무런 정보가 없이 유사성을 기반으로 자료를 그룹화하는 데 차이가 있다.

 

강사소개

강의자 : 이승연

· 서울대학교 계산통계학과 졸업

· 미국 미시간대학교(생물통계학박사)

· 현재: 세종대학교 수학통계학부 교수

 

과목소개

· 최근 의학, 보건학, 생물학, 약학 분야에 유전자의 통계적 분석이 활발히 연구되고 있는 바이오정보학의 여러 실전적 분야에 통계학이 어떻게 응용되는지 고찰하여 본다.

· 인간유전체 연구를 어떻게 실전적인 치료에 접목시키는가를 설명하고 유전체정보의 의미와 질병과의 관계를 살펴본다. 또한 유전체연구와 긴밀한 맞춤의학의 정의와 함께 실제 각 질환에 관련되는 유전체정보의 계량화 및 기본적인 분석 모형을 다룬다. 유전자료를 분석하는데 유용한 통계분석방법을 설명하고 구체적으로 암연구에서의 어레이 연구의 유용성 및 우리나라 암환자 통계자료의 등록과 관리 및 분석과정 등을 소개한다.

· 생명과 정보에 대한 연구 현황과 정보 유전체의학에 대한 개관 및 인간유전체연구의 발전에 따라 윤리적 사회적 문제에 대한 인식과 개인 유전정보의 보호를 위한 기본적인 원칙을 이해 하여 인간유전체 연구에 적용되는 규정을 정리한다. 실제 유전체자료 분석에 이용되는 통계패키지인 Bioconductor의 설치 및 실행방법, 분석 데이터구조 및 Bioconductor의 실제 수행을 실습해본다.