TL;DR
- Pinball Loss는 특정 분위수(quantile)를 예측하기 위한 비대칭 절대 오차 손실이다.
- 에서는 가 되며, 평균 Pinball Loss에 2를 곱하면 MAE가 된다.
- 를 낮추면 낮은 분위수, 를 높이면 높은 분위수 예측을 학습한다.
Pinball Loss

Pinball Loss 또는 Quantile Loss는 특정 분위수 를 예측하기 위한 손실 함수다. 평균이나 중앙값 하나를 예측하는 대신, 조건부 분포의 특정 위치를 학습할 때 사용한다.
여기서 이다.
일반 정의
Pinball Loss는 과소예측과 과대예측에 서로 다른 계수를 적용한다.
그림에서 x축의 residual은 다음과 같다.
이면 예측값이 실제값보다 큰 과대예측이고, 이면 예측값이 실제값보다 작은 과소예측이다.
- : 양쪽 계수가 같아지고 가 된다. 따라서 평균 Pinball Loss에 2를 곱하면 MAE가 된다.
- : 과대예측에 더 큰 페널티를 주므로 낮은 분위수 예측을 학습한다.
- : 과소예측에 더 큰 페널티를 주므로 높은 분위수 예측을 학습한다.
따라서 는 어느 분위수의 예측값을 학습할 것인가를 정하는 파라미터다.
예를 들어 실제값이 100이고 예측값이 90이면 과소예측 오차는 10이다. 에서는 손실이 이고, 에서는 다. 높은 는 과소예측에 더 큰 페널티를 준다.
일반 시계열에서의 사용
Pinball Loss는 점 예측 하나보다 분위수 예측이나 예측 구간이 필요한 시계열 문제에서 사용한다. 여러 에 대해 예측값을 만들면, 단일 예측값이 아니라 예측 분포의 일부를 표현할 수 있다.
비용 구조가 비대칭인 문제에서는 평균이나 중앙값보다 특정 분위수 예측이 더 적절할 수 있다. 예를 들어 과소예측 비용과 과대예측 비용이 다르면, 두 오류를 같은 무게로 보는 MAE보다 Pinball Loss가 의사결정에 더 잘 맞을 수 있다.
수요 예측에서의 사용
수요 예측에서 Pinball Loss는 서비스 레벨, 결품 비용, 과잉재고 비용처럼 비대칭 운영 비용을 반영할 때 유용하다.
여기서 는 과소예측 비용, 즉 결품·판매 기회 손실·서비스 레벨 저하 비용이고, 는 과대예측 비용, 즉 과잉재고·보관·폐기 비용이다.
- 결품 비용이 과잉재고 비용에 비해 상대적으로 크면 의 비중이 커지므로 도 커진다. 이 경우 모델은 과소예측을 더 크게 벌점화하고, 높은 분위수 예측을 학습한다.
- 과잉재고나 폐기 비용이 더 크면 가 커지므로 는 작아진다. 이 경우 모델은 과대예측을 더 크게 벌점화하고, 낮은 분위수 예측을 학습한다.
- 여러 에 대해 예측값을 만들면 단일 점 예측이 아니라 수요 예측 구간을 구성할 수 있다.
예를 들어 예측은 평균 수요를 맞히는 값이 아니라, 결품 비용을 크게 보는 상황에서 선택하는 높은 분위수 예측이다. 실제 수요가 예측값을 초과할 가능성을 낮추는 대신, 평균 예측보다 높은 값을 낼 수 있어 과잉재고 비용은 함께 커질 수 있다.
한계
- 선택한 가 실제 목표 서비스 레벨이나 비용 구조와 맞지 않으면, 낮은 손실값이 좋은 의사결정을 보장하지 않는다.
- 낮은 는 과대예측을 줄이는 데 도움이 될 수 있지만, 반복적으로 낮은 예측을 만들면 과소예측 편향이 생길 수 있다.
- 높은 는 결품 위험을 줄이는 데 유리할 수 있지만, 과잉재고나 폐기 비용을 키울 수 있다.
- Pinball Loss만으로는 예측의 평균적 정확도나 방향성을 충분히 알기 어렵다. MAE, WAPE, Forecast Bias와 함께 확인하는 것이 좋다.
Connections
- MAE — pinball loss는 절대오차의 절반이다.
- MAPE — right-skewed(오른쪽 꼬리가 긴) 수요에서는 낮은 quantile이 작은 실제값 구간의 과대예측을 줄일 수 있다.
- Forecast Bias — quantile 선택으로 생기는 과대예측/과소예측 경향을 확인한다.
- WAPE — 운영 총량 기준의 보조 평가 메트릭.


Discussion
Comments
댓글은 승인 후 공개됩니다.