본문으로 건너뛰기

"Feature selection" 태그로 연결된 1개 게시물개의 게시물이 있습니다.

특성 선택 - 모델 성능에 중요한 특성을 선별해 과적합을 방지하고 해석 가능성을 향상시키는 기법

모든 태그 보기

통계적 해석 방법과 모델 기반 방법을 사용한 차원축소: Elementary effect 기법과 random forest regressor 의 비교

· 약 5분
정인범
한양대학교 석사

논문 정보

  • 제목: Dimensionality reduction using statistical analysis and model based methods: a comparison between elementary effect method and random forest regressor
  • 저자: 정인범 (한양대학교 대학원)
  • 학회/저널: 한양대학교 대학원 석사학위논문
  • 발행일: 2018-02
  • DOI: (N/A, URI: 1804:null-200000432990)
  • 주요 연구 내용: 본 연구는 차원축소 기법을 변수선택(Filter, Wrapper, Embedded)과 변수추출(PCA, Autoencoder)로 분류함. 이후 통계적 해석(Filter) 방법인 Elementary Effect(EE) 기법과 모델 기반(Embedded) 방법인 Random Forest Regressor(RFR)의 변수 중요도 계산 방식과 성능을 비교 분석함.
  • 주요 결과 및 결론: 시뮬레이션 모델(데이터 생성 필요)의 경우, EE 기법(특히 Sampling for Uniformity)이 RFR보다 적은 해석 횟수로 높은 변수 선별 정확도를 보였음. 반면, 'Big data'와 같이 이미 데이터가 확보된 경우 RFR이 더 적합했음. 또한 RFR은 변수추출 기법인 Autoencoder보다 사용이 편리하고 우수한 성능을 보임.
  • 기여점: 서로 다른 학문적 배경(통계적 GSA vs. 기계학습)에서 발전한 두 주요 차원축소 기법(EE, RFR)의 성능을 정량적으로 비교, 분석하였음. 데이터 상황(시뮬레이션 vs. 기존 데이터)에 따라 적절한 기법을 선택해야 함을 실증적으로 제시함.