고려대학교 정경대학 통계학과

QUICK MENU
  • 로그인
  • 사이트맵
  • 고려대학교
  • KUPID
  • English

개설강좌소개 및 강의일정

강의 일정
일자 장소 강좌명 강사
06. 01 (금)
19:00 ~ 21:00
정경관 205호 Decision Trees and Random Forests 조형준 교수
06. 08 (금)
19:00 ~ 21:00
정경관 205호 패널자료의 분석 방법 송주원 교수
강좌 소개

 1. Decision Trees and Random Forests

  Decision trees는 재귀적으로 데이터를 분할하여 만든 계층적, 축차적 나무구조 모형으로 데이터의 내재된 정보를 의미 있게 시각적으로 표현하는 방법이다. 예측 변수의 확률 공간을 분할하여 반응 값을 예측하고 복잡한 데이터 구조를 쉽게 해석하기 위해 주로 이용된다. Random forests는 수많은 decision trees로 구성되어 각 모형의 결과를 종합하는 분류 방법이다. 나무구조 모형의 해석 용이성을 희생함에도 분할 변수를 랜덤하게 선택하는 독특한 방식으로 높은 예측력을 가진다. 본 강좌에서는 기본적인 이론과 주요 알고리즘, 그리고 실제 데이터 분석에 활용 사례를 소개한다.

 

 2. 패널자료의 분석 방법

  본 강의에서는 패널자료의 특성을 소개하고 이 자료의 분석에 사용되는 모형 및 추정 방법을 설명한다. 우선 자료가 정규분포를 따르는 경우 패널자료에 대한 일반선형모형(general linear model) 및 확률효과모형(random effects model)을 세우는 방법을 설명하고 각 모형에 대한 모수 추정을 위한 최대우도(maximum likelihood) 방법 및 제한최대우도(restricted maximum likelihood) 방법에 관하여 소개하고 비교한다. 또한, 자료가 이항(binary) 분포를 따르는 경우 패널자료에 대한 주변모형(marginal model)과 확률효과모형을 세우는 방법을 설명하고 두 모형을 비교한다. 또한, 주변모형의 모수 추정을 위한 GEE(generalized estimating equation) 방법 및 확률효과모형의 최대우도 추정방법을 설명한다. 실제 자료 예제를 사용하여 이 모형들의 적합 결과를 설명한다.