비슷한 글을 여기서도 작성한 적 있다.
랜덤포레스트와의 차이점을 통해 그레디언트 부스팅의 특징을 파악해보자.
랜덤 포레스트와 그래디언트 부스팅은 둘 다 트리 기반의 앙상블 학습 방법이지만,
학습 방식과 특징에 있어서 다음과 같은 차이점이 있다.
앙상블 방식:
랜덤 포레스트는 배깅(bagging)이라는 앙상블 방식을 사용.
- 여러 개의 결정 트리를 독립적으로 학습시키고, 그 예측을 집계하여 최종 예측을 생성.
그래디언트 부스팅은 부스팅(boosting)이라는 앙상블 방식을 사용.
- 단 한개의 시드 트리로 부터, 이전 트리의 오류를 줄이는 방향으로 학습되며, 이는 순차적인 과정.
과적합 방지:
랜덤 포레스트는 트리의 무작위성으로 인해 자연스럽게 과적합을 방지합니다.
그래디언트 부스팅은 규제(Regularization) 기능을 제공하여 과적합을 방지.
성능:
그래디언트 부스팅은 일반적으로 랜덤 포레스트보다 더 높은 예측 성능을 제공
랜덤 포레스트는 병렬 학습이 가능하므로 큰 데이터셋에 대해 빠르게 학습할 수 있습니다.
그래디언트 부스팅은 순차적인 학습 방식을 사용하므로 랜덤 포레스트보다 학습 속도가 느릴 수 있다.
XGBoost:
그래디언트 부스팅과 XGBoost는 기본적으로 같은 앙상블 학습 방법을 사용하지만,
XGBoost에는 이런저런 최적화 기능이 포함되어 있음
반응형
'AI, ML > ML' 카테고리의 다른 글
binning (0) | 2023.12.28 |
---|---|
디시전트리기반 코드 실습 (0) | 2023.10.16 |
랜덤 포레스트(random forest) (1) | 2023.10.15 |
윈도우 환경에서 ML환경 구축 (0) | 2022.03.09 |
케라스(Keras) (0) | 2020.04.13 |