반응형
금융 데이터 공급사를 바꾸는 일은 API 주소 하나를 갈아끼우는 작업처럼 보이지만, 실제로는 분석 기준을 통째로 옮기는 일이다. 같은 EPS라도 조정 기준, 통화, 회계 기간, 발표일 처리 방식이 다르면 결과가 달라진다.

전환 전에 같은 줄에 놓고 볼 것
| 축 | 확인 질문 | 놓치면 생기는 문제 |
|---|---|---|
| 범위 | 시장, 종목, 과거 기간이 충분한가 | 백테스트 표본이 달라짐 |
| 정의 | 필드 의미와 조정 기준이 같은가 | 지표가 조용히 바뀜 |
| 비용 | 호출 제한과 저장 정책이 맞는가 | 배치 시간이 늘어남 |
| 운영 | 장애, 지연, 재처리 절차가 있는가 | 데이터 공백이 생김 |
비용은 요금표보다 넓게 잡는다
total_switch_cost = vendor_fee
+ rebuild_hours * hourly_cost
+ parallel_run_days * daily_pipeline_cost
+ validation_failures * fix_cost
요금만 싸다고 바로 옮기면 검증 비용이 뒤에서 튀어나온다. 특히 과거 데이터가 길수록 병행 운영 기간을 짧게 잡으면 안 된다.
전환 검증 순서
- 핵심 종목 100개를 고르고, 기존 원천과 신규 원천의 주요 필드를 같은 날짜 기준으로 붙인다.
- 차이가 나는 필드는 오류로 단정하지 말고 정의 차이, 지연 반영, 조정 기준 차이로 나눈다.
- 한 번에 전체 전환하지 말고 읽기 전용 병행 기간을 둔다.
독자가 바로 써먹을 기준
새 공급사를 도입할 때는 “더 많은 필드”보다 “내가 쓰는 필드가 같은 의미로 재현되는가”를 먼저 확인한다.
함께 보면 좋은 글
반응형
'Data Engineering' 카테고리의 다른 글
| OHLCV 결측치 보정 기준: 가격 데이터 빈칸을 다룰 때 (0) | 2026.06.14 |
|---|---|
| 분기 재무 데이터 구축 방법: 제출일, 수정 데이터, 재처리 기준 (0) | 2026.06.14 |
| 기업 데이터 식별자 매핑 설계: 내부 키와 외부 키를 맞추는 법 (0) | 2026.06.14 |
| 주식 데이터 정합성 점검: 누락, 중복, 기준일 확인 방법 (0) | 2026.06.02 |
| Learning Rate와 Iteration 관계: 반복 횟수에 따른 수렴 변화 (0) | 2026.05.24 |
