반응형

핵심 정리

푸아송 분포는 일정한 시간이나 구간에서 사건이 몇 번 발생하는지를 모델링하는 이산 확률분포입니다. 단위 구간의 평균 발생 횟수를 lambda로 두면, 페이지당 오타 수나 일정 시간의 사고 건수처럼 횟수에 관한 확률을 계산할 수 있습니다.

  • 확률변수 X는 발생 횟수이므로 0, 1, 2와 같은 음이 아닌 정수 값을 갖고, lambda는 같은 크기의 구간에서 기대하는 평균 발생 횟수입니다.
  • 사건의 발생이 서로 독립적이고 평균 발생률이 구간 안에서 일정하다는 가정이 푸아송 모형을 사용할 때의 핵심입니다.
  • 시행 횟수 n이 크고 개별 발생 확률 p가 작다면, lambda = n p로 두어 이항분포를 푸아송 분포로 근사할 수 있습니다.
  • 원문에서 든 페이지당 평균 오타 2개 예제는 lambda = 2인 상황에서 오타가 특정 횟수 발생할 확률을 계산하는 전형적인 활용입니다.

푸아송 분포는 성공 여부 하나가 아니라 일정 구간의 발생 횟수가 궁금할 때 읽는 도구입니다. 아래 원문은 분포 표기, 확률식, 이항분포와의 관계를 이어서 정리합니다.

이어서 볼 글

 

푸아송 분포(Poisson Distribution)

확률론에서, 푸아송 분포(Poisson分布, 영어: Poisson distribution)는 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포이다.

푸아송 분포는 이항 분포의 특수한 형태로 볼 수 있다.

$X \sim \textrm{B}(n,p). \,$

이항분포를 따르는 위와 같은 확률변수 X에서, n이 대단히 크고 p가 대단히 작을 경우, 이 확률변수 X는 λ=np인 푸아송 분포로 근사할 수 있다.

$X \sim \textrm{Pois}(\lambda)$ 로 표기

정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값을 $\lambda$라고 했을 때, 그 사건이 n회 일어날 확률은 다음과 같다.

$f(n; \lambda)=\frac{\lambda^n e^{-\lambda}}{n!},\,\!$

여기에 따르면,

어떤 사건에 대해서 실패, 성공 또는 앞면, 뒷면과 같이 2가지 이상의 상황에 대해서 관심이 있는 것이 아니라,

시간에 따른 교통사고 횟수등 발생 횟수에만 관심이 있을때 푸아송 분포를 적용할 수 있다고 한다.

여기에 따르면

구간마다 사건이 일어나는 평균값 λ를 알고 있다고 치면, 어떤 주어진 구건에 사건이 발생하는 수 X를 예측하겠다는 것

뭔가 직관적으로, 대충 요게 이정도 일어나는 애라는걸 아는데,

내가 원하는 구간동안에 몇번 일어날 지를 알고 싶을 때 이 분포를 가정하면 된다는것...

이자료를 보면, 이항분포 식으로 부터 푸아송 식을 유도할 수 있다. (n이 크고 p가 작다는 가정하에)

반응형

+ Recent posts