반응형
분기 재무 데이터는 “2024년 4분기 매출”처럼 단순한 숫자로 보이지만, 데이터베이스에 넣을 때는 숫자보다 제출 시점이 더 중요하다. 최초 제출 뒤에 수정 보고서가 나오면 과거 값이 바뀌고, 그 값을 언제 알 수 있었는지도 달라진다.

한 분기에 여러 버전이 생기는 이유
기업은 같은 회계 기간에 대해 최초 보고, 수정 보고, 재작성 자료를 낼 수 있다. 분석 기준일을 무시하면 미래에 공개된 수정치를 과거 분석에 섞는 look-ahead bias가 생긴다.
| 필드 | 의미 | 예시 |
|---|---|---|
| fiscal_period | 회계 기준 기간 | 2024Q4 |
| filed_at | 자료가 공개된 날짜 | 2025-02-14 |
| accepted_at | 원천이 접수한 시각 | 2025-02-14 21:05 |
| revision_no | 같은 기간 내 버전 | 0, 1, 2 |
버전 키를 먼저 정한다
version_key = (company_id, fiscal_year, fiscal_quarter, filed_at, form_type)
as_of_view(date) = latest version where filed_at <= date
분석에서의 기준
과거 시점 성과를 재현하려면 최신 값 테이블과 as-of 테이블을 분리한다. 최신 값은 화면 조회에 좋고, as-of 값은 백테스트에 맞다.
재처리 체크리스트
- 수정 보고서가 들어오면 해당 기업만 다시 계산할지, 연결 지표까지 재계산할지 범위를 정한다.
- 재처리 전후 row count, key count, 주요 합계가 얼마나 바뀌었는지 남긴다.
- 분기와 누적 값을 한 테이블에 넣을 때는 period_type을 둔다.
함께 보면 좋은 글
반응형
'Data Engineering' 카테고리의 다른 글
| 티커 재사용 문제 처리: 상장폐지 종목을 구분하는 법 (0) | 2026.06.14 |
|---|---|
| OHLCV 결측치 보정 기준: 가격 데이터 빈칸을 다룰 때 (0) | 2026.06.14 |
| 외부 금융 데이터 소스 전환 검토 기준: 범위, 품질, 비용 (0) | 2026.06.14 |
| 기업 데이터 식별자 매핑 설계: 내부 키와 외부 키를 맞추는 법 (0) | 2026.06.14 |
| 주식 데이터 정합성 점검: 누락, 중복, 기준일 확인 방법 (0) | 2026.06.02 |
