직관
단일변수에 대한 z검정 또는 t검정은 귀무가설과 대립가설을 세우고, 표준정규분포 또는 t분포와 p-value를 통해서 유의성을 검증하는데,
아래와 같이 두 변수의 연관성에 대한 검증을 할때는, 정규분포 또는 t분포가 아닌 카이제곱분포를 따르는것이 알려져 있으며,
상세
카이제곱 검정을 이해하기 위해서는 카이분포를 먼저 이해해야 한다.
카이분포를 이해하기 위해서는 정규분포와 감마분포를 이해해야 한다.
감마분포는 아래 감마함수와 연관되어 있고, 팩토리얼을 실수 및 복소수까지 일반화한 바로 그 함수이다.
감마분포는 확률밀도함수 형태여야 하므로 감마함수에서 전체 적분값이 1.0이 되도록 맞춰주면 나온다.
근데, 정규분포에서 평균m과 표준편차 $\sigma$가 파라미터로 추가되듯, 여기서도 감마분포의 특성을 고려해 알파,베타 파라미터를 추가하면 다음과 같다.
위처럼 감마분포는 보통 x>0 인 구간에 대해서만 사용하는 것 같다. (정규분포는 모든 x구간 사용)
파이선에서 알파,베타를 바꿔가면서 감마분포를 그려보면 다음과 같다 (scipy.stat의 gamma.pdf 사용)
$\beta$가 커질수록 그래프는 더 퍼지는 형태를 띠게 되고, $\alpha$가 커질수록 bell shape에 가까운 모양이 됨을 알 수 있다.
카이제곱분포는 감마분포에서 , β= 2로 고정한 특별한 경우이다 .
자유도가 r인 카이제곱분포는 감마분포 $\Gamma({r\over 2},2)$에 해당되며, 확률밀도함수는 다음과 같다.
TODO
* 감마분포의 자연스러운 사용 예제
* 카이제곱검정에서 셀을통한 계산을 하면 카이제곱분포의 x값이 나오는 정확한 이유
'수학 > 통계' 카테고리의 다른 글
베르누이 분포(bernoulli distribution) (0) | 2019.06.27 |
---|---|
베타함수, 베타분포 (0) | 2019.06.27 |
깁스 샘플링(Gibbs Sampling) (0) | 2019.06.26 |
정규분포 (1) | 2019.06.20 |
가설검정, 유의수준, 귀무가설, 대립가설, p-value(p값), t-test(t검정), z-test(z검정) (0) | 2019.04.26 |