여기여기를 참조했음을 밝힙니다.


정의

어떤 배열이 있을때 중복을 허용하여 n개를 sampling할 때 이를 sampling with repliacement라고 하며, 이때 생성된 sampling 배열을 bootstrap이라고 한다.


예를 들어 [A, B, C, D, E]란 배열이 있고 중복을 허용하여 7개를 sampling 한다고 하면

[A, C, D, A, E, E, B] 와 같은 배열이 만들어 질것이고 이 배열을 bootstrap이라고 한다는 것


활용도

통계적으로는 평균의 신뢰도구간등을 측정하는 등의 용도로 쓸 수 있고,

ML측면에서는 모델 개수를 늘려서 오버피팅을 피하는 앙상블을 하기 좋다는 측면이 있다.



반응형

'수학' 카테고리의 다른 글

모듈러연산  (0) 2020.04.04
베이즈 추론(Bayesian inference)  (0) 2019.06.27
공분산(Covariance)과 상관계수(Correlation Coefficient)  (0) 2019.01.18
확률변수(random variable)  (0) 2019.01.18
직교행렬(orthogonal matrix)  (0) 2019.01.09

+ Recent posts