빅데이터 분석 기법(알고리즘) [Bagging] 모델의안정성을높이기위하여분석데이터로부터여러개의 단순복원임의추출(BootStrap)하여 다수결을통해최종의예측모델을도출하는알고리즘(Bootstrap aggregating)
[절차]
1) Row data에서 bootstrap 데이터추출
2) 추출을반복하여 n개의데이터생성
3) 각데이터를각각모델링하여모델생성
4) 단일모델을결합하여배깅모델생성

[Boosting] 모델의정확성을높이기위하여오분류된개체들에가중치를부여함으로써새로운분류규칙을만드는단계를반복하여 약한분류모델을강한분류모델로변형(Boosting)하는알고리즘
[절차]
1) Row data에동일가중치로모델생성
2) 생성된모델로인한오분류데이터수집
3) 오분류데이터에높은가중치부여
4) 과정반복을통하여모델의정확도향상
※배깅 : 부스팅+보팅


토픽 이름 () 빅데이터 분석 기법(배깅,부스팅)
분류 DB > Big Data > 빅데이터 분석 기법(배깅,부스팅)
키워드(암기) 배깅(bagging; bootstrap aggregating, 개별 모델),
암기법(해당경우)  

 

기출문제

번호 문제 회차
1 4. 빅데이터 분석방법인 Bagging Boosting 기법을 비교하여 설명하시오 105.정보관리.1.

 

I. 분류모델 생성 알고리즘 Bagging Boosting

Bagging Boosting
주어진 데이터에서 여러 개의 bootstrap 자료를 생성하고, 각 자료를 모델링 한 후 결합 (Bootstrap
Aggregating)하여 최종 예측 모형을 만드는 알고리즘
잘못 분류된 개체들에 가중치를 적용하여 새로운 분류규칙을 만들고, 과정을 반복해 최종 예측 모형을 만드는 Boosting(변형) 알고리즘

- Bagging Boosting 데이터 마이닝에서 분류를 수행하기 위한 분류모델을 하는 알고리즘.

[참고] 부트스트랩(bootstrap): 여러 개의 표본에서 추가적으로 표본을 복원 추출하고 표본에 대한 통계량을 다시 계산하는 기법 혹은 그 절차를 부트스트랩() 이라고 .

 

 

II. Bagging Boosting 알고리즘 비교 설명

. Bagging Boosting 알고리즘 수행방법 비교

구분 설명
Bagging

1) Row data에서 bootstrap 데이터 추출
2) 추출을 반복하여 n개의 데이터 생성
3) 데이터를 각각 모델링 하여 모델 생성
4) 단일 모델을 결합하여 배깅 모델 생성
Boosting

1) Row data 동일가중치로 모델 생성
2) 생성된 모델로 인한 오분류 데이터 수집
3) 오분류 데이터에 높은 가중치 부여
4) 과정 반복을 통하여 모델의 정확도 향상

- Bagging 여러 번의 sampling 통해 분산을 줄여 모델의 변동성을 감소시키는 방법

- Boosting 잘못 분류된 데이터에 집중해 모델의 정확도를 향상시키는 방법

 

. Bagging Boosting알고리즘의 기술적 특징 비교

항목 Bagging Boosting
수행원리 샘플링에 의한 결합 가중치 재조정에 의한 반복
수행목적 모델의 변동성(분산) 감소 모델의 정확도 향상
적용연산 평균, 다중투표 가중치 선형 결합
초기모델 Bootstrap 모델 (개별 모델) Weak classification 모델
최종모델 Bagging 모델 (결합 모델) Strong classification 모델
분류성능 데이터에 결측치가 존재할 경우 우수 데이터의 수가 많을 경우 우수

- 데이터 마이닝에서 분류문제를 해결하고자 중요한 문제는 주어진 데이터를 이용해 목표변수를 가장

잘 예측할 수 있는 모델을 생성하는 것이므로, 데이터 특성에 따라 모델을 생성하는 알고리즘의 선택적 적용이

필요함.

 

반응형

'정보관리기술사 > DB_데이터분석' 카테고리의 다른 글

랜덤 포레스트(Random Forest)  (0) 2023.08.22
앙상블 학습/모델  (0) 2023.08.21
NoSQL(CAP이론)  (0) 2023.08.19
5차 정규화  (0) 2023.08.18
4차 정규화  (0) 2023.08.17

+ Recent posts