반응형

분기 재무 데이터는 “2024년 4분기 매출”처럼 단순한 숫자로 보이지만, 데이터베이스에 넣을 때는 숫자보다 제출 시점이 더 중요하다. 최초 제출 뒤에 수정 보고서가 나오면 과거 값이 바뀌고, 그 값을 언제 알 수 있었는지도 달라진다.

분기 재무 데이터 구축 방법: 제출일, 수정 데이터, 재처리 기준 핵심 흐름과 판단식 도식
분기 재무 데이터 구축 방법: 제출일, 수정 데이터, 재처리 기준 핵심 구조도

한 분기에 여러 버전이 생기는 이유

기업은 같은 회계 기간에 대해 최초 보고, 수정 보고, 재작성 자료를 낼 수 있다. 분석 기준일을 무시하면 미래에 공개된 수정치를 과거 분석에 섞는 look-ahead bias가 생긴다.

필드 의미 예시
fiscal_period 회계 기준 기간 2024Q4
filed_at 자료가 공개된 날짜 2025-02-14
accepted_at 원천이 접수한 시각 2025-02-14 21:05
revision_no 같은 기간 내 버전 0, 1, 2

버전 키를 먼저 정한다

version_key = (company_id, fiscal_year, fiscal_quarter, filed_at, form_type)

as_of_view(date) = latest version where filed_at <= date

분석에서의 기준

과거 시점 성과를 재현하려면 최신 값 테이블과 as-of 테이블을 분리한다. 최신 값은 화면 조회에 좋고, as-of 값은 백테스트에 맞다.

재처리 체크리스트

  • 수정 보고서가 들어오면 해당 기업만 다시 계산할지, 연결 지표까지 재계산할지 범위를 정한다.
  • 재처리 전후 row count, key count, 주요 합계가 얼마나 바뀌었는지 남긴다.
  • 분기와 누적 값을 한 테이블에 넣을 때는 period_type을 둔다.

함께 보면 좋은 글

반응형

+ Recent posts