조건부 확률의 정의에 의해서..
$P(A|B) = {P(A \cap B) \over P(B)}$
이렇게 되는데..
위 식을 $P(A \cap B)$에 대해서 다시 정리하면 $P(A \cap B) = P(A|B)P(B)$가 된다.
(A와 B가 독립이라면 $P(A \cap B) = P(A)P(B)$ 이렇게 간단하게 되지만.. 문제는 항상 그렇지 않다는것)
A와 B를 바꾸면 $P(A \cap B) = P(B|A)P(A)$
따라서
$P(A|B) = {P(A \cap B) \over P(B)} = {{P(B|A)P(A)} \over P(B)}$가 되고 이를 베이즈 정리라고 부른다.
유도자체는 참 쉬운데, 예제를 통해 직관적으로 파악하기는 어려운 편으로.. 한 번 예를 들어보자.
(아례 예제들은 여기서 가져왔다.)
예제1
두개의 노트북 조립라인을 가진 공장에서 생산된 1,000대씩의 노트북들을 같은 화물 창고에 쌓아 놓았다. 각각의 조립라인을 정밀하게 조사하여, 1번 조립라인에서 생산된 노트북의 10%가 불량이고, 2번 조립라인에서 생산된 노트북의 15%가 불량임을 알았다. 화물 창고의 노트북을 하나 꺼내 조사한 결과 불량이었을 때, 이 노트북이 1번 조립라인에서 생산되었을 확률은?
사건 1 = 1번공장에서 노트북이 나옴
사건 2 = 2번공장에서 노트북이 나옴
사건 불량 = 노트북이 불량임
으로 정의하면
문제에서 주어진 값들은 P(불량|1)=0.1, P(불량|2)=0.15 이다.
또한 P(1) = P(2) = 0.5임을 유추할 수 있다.
구하고자 하는 값은 P(1|불량) 이므로
베이즈 정리를 적용하면
$P(1|불량) = P(불량|1)P(1) / P(불량)$인데, 여기서 문제가 생겼다. $P(불량)$은 주어지지 않은 값이기 때문 ㅋ
근데 조금 까다롭지만 곰곰히 생각해보면 $P(불량) = P(불량 \cap 1) + P(불량 \cap 2)$임을 유추할 수 있다.
따라서
$P(1|불량) = P(불량|1)P(1) / P(불량) = {{P(불량|1)P(1)} \over {P(불량 \cap 1) + P(불량 \cap 2)}} = {{P(불량|1)P(1)} \over {P(불량|1)P(1) + P(불량|2)P(2)}}$
가 되고,
P(1) = P(2) = 0.5이므로 약분시키고, 위에 알려진 숫자들을 다 대입하면,
$P(1|불량) = {{P(불량|1)} \over {P(불량|1) + P(불량|2)}} = {0.1 \over {0.1 \times 0.15}} = 0.4$
답은 40%가 된다.
사후확률
- P(A) : A의 사전확률 (a prioi). 어떠한 사건에 대한 정보가 없을 때의 확률.
- P(A|B) : B에 대한 A의 사후확률 (posteriori). B라는 정보가 주어졌을 때의 확률.
'수학' 카테고리의 다른 글
likelihood(가능도 = 우도) (0) | 2018.10.02 |
---|---|
MLE, 최대우도추정(Maximum Likelihood Estimation) (0) | 2018.09.27 |
독립사건, 독립시행 (0) | 2018.09.27 |
조건부 확률 (0) | 2018.09.27 |
조합 (0) | 2017.11.08 |