앙상블 학습/모델 [정의]주어진데이터로부터여러개의모델을학습한다음, 예측시여러모델의예측결과들을종합하여정확도를높이는기법
앙상블학습(Ensemble learning)
배깅
부스팅
랜덤포레스트

 
 
토픽 이름 () 앙상블 학습
분류 DB > Big Data > 앙상블 학습
키워드(암기) 배깅(bagging; bootstrap aggregating, 개별 모델)
암기법(해당경우)  

 

 

I. 빅데이터, 머신러닝의 학습 알고리즘(learning algorithm), 앙상블 기법의 개요

. 앙상블기법의 정의

- 빅데이터 분석 기계학습 기법으로써, 개별 모형 하나로 원하는 성능을 낼 수 없을 때 개별로 학습한

  여러 학습기법(배깅, 부스팅, 렌덤 포레스토) 를 조합해, 좋은 예측 성능을 얻는 기법

  • 여러 개의 의사결정 트리를 만들고 투표하여 다수결로 결과를 결정하는 방법
  1. 앙상블학습의 등장배경
단계 내용
감독학습의
과적합 문제
결과 또는 성능의 변동폭이 크다는 문제 및
학습데이터에 따라 생성되는 결정 트리가 크게 달라져
일반화하기 어려운 과적합(overfitting)문제
과적합 문제
극복 필요
임의화 기술을 통해 각 일반화 성능을 향상시켜 과적합문제 극복의 필요
  • ※ 과적합(overfitting)문제: 감독학습(Supervised Learning)에서 과거의 학습데이터에 대해서는 잘 예측하지만 새로 들어온 데이터에 대해서 성능이 떨어져서 일반화가 어려운 문제

 

II. 앙상블학습의 개념도 주요기법

. 앙상블 학습의 개념도

  • 여러 개의 분류기를 통해 예측결과를 도출하고 이 결과를 결합하여 신뢰성이 높은 예측 값 도출
  1. 앙상블 학습의 주요기법
주요기법 개념도 설명
Bagging
Bootstrap 통해 모델링한 결합하여 최종 예측모델 생성
Boosting
Weak classifier 가중치를
적용하여
최종 bosting 모델을 만듦
Random forest
배깅을 이용하여 여러 개의
결정트리를 생성 후
학습시키고 투표 및 확률을
이용하여 최종 모델 생성

 

반응형

'정보관리기술사 > DB_데이터분석' 카테고리의 다른 글

아파치 카프카(apache kafka)  (1) 2023.08.23
랜덤 포레스트(Random Forest)  (0) 2023.08.22
빅데이터 분석 기법(알고리즘)  (0) 2023.08.20
NoSQL(CAP이론)  (0) 2023.08.19
5차 정규화  (0) 2023.08.18

+ Recent posts