17건의 항목

개념 노트

시계열 검증에서 예측 기준일을 이동시키는 방법

Rolling-origin evaluation은 예측 기준일을 시간 순서대로 이동시키며 여러 번 평가하는 방법이다. 단일 cutoff의 운을 줄이고, 미래 정보가 과거 학습에 섞이는 것을 막는다.

개념 노트

시계열 데이터

시계열 데이터는 시간 순서가 의미를 갖고, 이전 관측값이 이후 관측값에 정보를 제공하는 데이터다. 이 때문에 일반 i.i.d. 데이터처럼 무작위로 섞어 학습·검증하면 시간 leakage가 생길 수 있다.

개념 노트

시계열 분해

시계열 분해는 관측값을 추세(trend), 계절성(seasonality), 잔차(residual)로 나누어 본다. 예측 모델의 feature와 오류 분석을 구조적으로 해석하는 데 유용하다.

개념 노트

Forecast Bias

Forecast Bias는 예측이 누적으로 과대인지 과소인지를 보는 signed metric이다. 이 노트에서는 forecast-minus-actual convention을 사용한 normalized forecast bias를 다룬다....

개념 노트

Regime Shift와 Structural Break

Regime shift는 시계열의 통계적 특성이 특정 시점 이후 달라지는 현상을 넓게 부르는 말이다. 엄밀한 분석에서는 structural break, level shift, trend change, variance change, reg...

개념 노트

단변량 타깃과 다변량 입력

시계열 예측에서 univariate, multivariate, multivariable은 타깃 개수와 입력 변수 개수를 섞어 쓰기 때문에 혼동된다. “univariate target with multivariate input”처럼 타깃과...

개념 노트

시계열 예측에서 예측 시점에 알 수 있는 변수와 알 수 없는 변수

시계열 예측에서 feature는 예측 시점에 알 수 있었는지를 기준으로 나눠야 한다. Future-known feature는 미래 기간의 값을 미리 알 수 있는 변수이고, past-only feature는 시간이 지나야 관측되는 변수다.

개념 노트

시계열 예측의 기준 시점과 예측 기간

시계열 예측에서는 언제 예측을 시작하는지와 얼마나 먼 미래를 예측하는지를 먼저 정해야 한다. 시계열 feature와 target은 항상 cutoff 기준으로 정의해야 한다.

개념 노트

여러 미래 시점을 예측하는 Multi-Horizon Forecasting

Multi-horizon forecasting은 하나의 예측 기준 시점에서 여러 미래 시점을 예측하는 문제다. recursive, direct, DirRec, MIMO 전략은 오류 누적과 학습 구조가 다르다.

개념 노트

외생변수와 내생변수

내생변수는 예측 대상 자체 또는 그 과거에서 나온 정보이고, 외생변수는 시스템 밖에서 주어지는 설명 변수다. 외생변수도 예측 시점에 알 수 있는지에 따라 사용 가능성이 달라진다.

개념 노트

Fill Rate

Fill Rate(주문 충족률)는 예측 정확도 지표가 아니라, 고객이 요청한 수량 중 실제로 얼마나 충족했는지 를 보는 공급망 운영 지표다. 수요 예측은 Fill Rate에 간접적으로 영향을 준다. 과소예측은 결품을 만들고, 과대예측은...

개념 노트

Pinball Loss

Pinball Loss는 특정 분위수(quantile)를 예측하기 위한 비대칭 절대 오차 손실이다. \tau=0.5에서는 0.5|y-\hat{y}|가 되며, 평균 Pinball Loss에 2를 곱하면 MAE가 된다. \tau를 낮추면 낮...

개념 노트

WAPE

WAPE(가중 절대 퍼센트 오차)는 ‘전체 수요(실제값의 합)’ 대비 ‘전체 오차’가 얼마나 되는지를 보는 총량 기준의 예측 평가 지표다. 개별 건마다 오차율을 평균 내는 MAPE와 달리, 판매량이 많거나 규모가 큰 상품의 오차에 더 큰...

개념 노트

MAE

MAE는 예측값과 실제값의 절대 오차 평균이다. 원래 타깃 단위로 해석할 수 있고, 오차 크기에 비례해 증가한다.

개념 노트

MAPE

MAPE는 절대 오차를 실제값으로 나눈 뒤 평균낸 상대 오차 메트릭이다. 스케일 독립적으로 해석하기 쉽지만, 실제값이 0 또는 0에 가까울 때 값이 크게 흔들린다.

개념 노트

1-MAPE

1-MAPE는 MAPE를 “정확도”처럼 보이게 뒤집은 보고용 표현이다. 새 메트릭이 아니므로 MAPE의 한계를 그대로 물려받고, MAPE가 1을 넘으면 음수가 된다.

개념 노트

SKU (Stock Keeping Unit)

SKU는 재고·판매·발주를 추적하기 위해 조직 내부에서 정의하는 상품/재고 관리 단위다. 예측과 메트릭에서는 SKU 자체보다 SKU에 매장, 채널, 날짜 등이 결합된 관측 단위가 중요하다.