통계학 기초: 평균, 분산, 표준편차와 기하평균 ::: Sevity Blog

통계학 기초: 평균, 분산, 표준편차와 기하평균

2026. 5. 31. 17:19

통계학을 처음 볼 때 평균만 이해하면 충분하다고 생각하기 쉽지만, 실제 데이터 해석에서는 분산과 표준편차, 기하평균까지 함께 봐야 전체 그림이 잡힌다.

핵심 개념

산술평균은 값을 모두 더해 개수로 나눈 대표값이다.
분산은 값들이 평균에서 얼마나 떨어져 있는지를 제곱 거리로 나타낸다.
표준편차는 분산에 루트를 씌워 원래 데이터 단위에 가깝게 해석하도록 만든 값이다.

기하평균이 필요한 경우

수익률처럼 여러 기간 동안 곱으로 누적되는 값은 산술평균만으로 설명하기 어렵다.
예를 들어 한 해에는 크게 오르고 다음 해에는 크게 떨어지는 경우, 단순 평균은 실제 누적 결과를 과대평가할 수 있다.
기하평균은 변화율을 곱셈 구조로 다루기 때문에 장기 성장률이나 복리 수익률을 볼 때 자주 쓰인다.

계산할 때 주의할 점

퍼센트와 소수 표기를 섞지 않는다. 3%는 0.03이고, 0.3%는 0.003이다.
평균 하나만 제시하지 말고 표준편차나 범위도 함께 확인한다.
데이터가 왜곡되어 있거나 극단값이 많다면 중앙값과 분위수도 같이 보는 편이 안전하다.

읽을 때 확인할 점

통계학 기초: 평균, 분산, 표준편차와 기하평균를 볼 때는 먼저 용어의 정의와 적용 조건을 분리해서 보는 것이 좋다. 같은 표현이라도 개발 환경, 데이터 형태, 사용 목적에 따라 실제 의미가 달라질 수 있기 때문이다.

지금 해결하려는 문제가 개념 이해인지, 구현 적용인지, 결과 해석인지 먼저 나눈다.
예제의 전제 조건이 내 상황과 같은지 확인한 뒤 필요한 부분만 가져온다.
결과가 기대와 다르면 입력, 설정, 경계 조건을 순서대로 좁혀서 확인한다.

적용 체크리스트

핵심 용어를 한 문장으로 설명할 수 있는지 확인한다.
작은 예제나 샘플 데이터로 동작을 먼저 검증한다.
실제 적용 전에는 입력 조건, 예외 케이스, 결과 해석 기준을 따로 적어 둔다.

함께 보면 좋은 글

마무리

통계학 기초: 평균, 분산, 표준편차와 기하평균는 개념 자체보다 적용 상황과 한계를 함께 보는 것이 중요하다. 작은 예제로 동작을 확인하고, 실제 환경에서는 입력 조건과 예외 케이스를 따로 점검하는 습관을 두면 시행착오를 줄일 수 있다.

저작자표시 (새창열림)

'AI, ML' 카테고리의 다른 글

푸아송 분포 예제: 드문 사건의 발생 횟수 모델링 (0)	2026.05.31
R 언어 입문: 통계 분석 흐름과 기본 사용법 (0)	2026.05.31
퍼셉트론 개념과 AND 게이트 예제: 가중합, 임계값, 신경망 기초 (0)	2026.05.26
기계학습 기초: Training Set, Test Set, Neural Network (0)	2026.05.25
머신러닝 학습 자료 메모: TensorFlow, XOR, sigmoid, ReLU (0)	2026.05.21

+ Recent posts

Powered by Tistory, Designed by wallel

티스토리툴바