핵심 정리
푸아송 분포는 일정한 시간이나 구간에서 사건이 몇 번 발생하는지를 모델링하는 이산 확률분포입니다. 단위 구간의 평균 발생 횟수를 lambda로 두면, 페이지당 오타 수나 일정 시간의 사고 건수처럼 횟수에 관한 확률을 계산할 수 있습니다.
- 확률변수 X는 발생 횟수이므로 0, 1, 2와 같은 음이 아닌 정수 값을 갖고, lambda는 같은 크기의 구간에서 기대하는 평균 발생 횟수입니다.
- 사건의 발생이 서로 독립적이고 평균 발생률이 구간 안에서 일정하다는 가정이 푸아송 모형을 사용할 때의 핵심입니다.
- 시행 횟수 n이 크고 개별 발생 확률 p가 작다면, lambda = n p로 두어 이항분포를 푸아송 분포로 근사할 수 있습니다.
- 원문에서 든 페이지당 평균 오타 2개 예제는 lambda = 2인 상황에서 오타가 특정 횟수 발생할 확률을 계산하는 전형적인 활용입니다.
푸아송 분포는 성공 여부 하나가 아니라 일정 구간의 발생 횟수가 궁금할 때 읽는 도구입니다. 아래 원문은 분포 표기, 확률식, 이항분포와의 관계를 이어서 정리합니다.
이어서 볼 글
- 확률변수 개념: 표본공간의 결과를 수치 함수로 해석하기 - 푸아송 분포의 X를 표본 결과에서 수치로 옮기는 관점부터 확인할 수 있다.
- 이항 분포 개념: 확률질량함수와 Python 계산 예제 - 푸아송 글이 언급하는 이항분포와 성공 횟수의 기본 식을 먼저 확인할 수 있다.
푸아송 분포(Poisson Distribution)
확률론에서, 푸아송 분포(Poisson分布, 영어: Poisson distribution)는 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포이다.
푸아송 분포는 이항 분포의 특수한 형태로 볼 수 있다.
$X \sim \textrm{B}(n,p). \,$
이항분포를 따르는 위와 같은 확률변수 X에서, n이 대단히 크고 p가 대단히 작을 경우, 이 확률변수 X는 λ=np인 푸아송 분포로 근사할 수 있다.
$X \sim \textrm{Pois}(\lambda)$ 로 표기
정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값을 $\lambda$라고 했을 때, 그 사건이 n회 일어날 확률은 다음과 같다.
$f(n; \lambda)=\frac{\lambda^n e^{-\lambda}}{n!},\,\!$
여기에 따르면,
어떤 사건에 대해서 실패, 성공 또는 앞면, 뒷면과 같이 2가지 이상의 상황에 대해서 관심이 있는 것이 아니라,
시간에 따른 교통사고 횟수등 발생 횟수에만 관심이 있을때 푸아송 분포를 적용할 수 있다고 한다.
여기에 따르면
구간마다 사건이 일어나는 평균값 λ를 알고 있다고 치면, 어떤 주어진 구건에 사건이 발생하는 수 X를 예측하겠다는 것
뭔가 직관적으로, 대충 요게 이정도 일어나는 애라는걸 아는데,
내가 원하는 구간동안에 몇번 일어날 지를 알고 싶을 때 이 분포를 가정하면 된다는것...
이자료를 보면, 이항분포 식으로 부터 푸아송 식을 유도할 수 있다. (n이 크고 p가 작다는 가정하에)
'tistory' 카테고리의 다른 글
| 특징 추출 개념: 모델 입력을 만드는 방법 (0) | 2026.05.31 |
|---|---|
| 알고리즘 문제 출제 기준: 난이도와 검증 케이스 설계 (0) | 2026.05.31 |
| 확률변수 개념: 표본공간의 결과를 수치 함수로 해석하기 (0) | 2026.05.26 |
| 베이즈 정리와 베이지안 네트워크: 조건부 확률과 DAG (0) | 2026.05.25 |
| Makefile 기초: 첫 번째 target, 자동 컴파일, CC와 CFLAGS (0) | 2026.05.25 |
