Pinball Loss

最終更新 2020-06-03 読了時間 1 分

まとめ

Pinball Loss は分位点予測のズレを評価する損失関数です。
分位回帰で Pinball Loss を算出し、τ の値による重み付けを確認します。
需要予測やリスク評価での活用方法と閾値設定の注意点を整理します。

1. 定義 #

分位点 $\tau$ におけるピンボール損失は、

$$ L_\tau(y, \hat{y}) = \begin{cases} \tau (y - \hat{y}) & \text{if } y \ge \hat{y} \\ (1 - \tau)(\hat{y} - y) & \text{otherwise} \end{cases} $$

予測値が分位点より低すぎれば $\tau$ 倍、逆に高すぎれば $1-\tau$ 倍のペナルティが課されます。

2. Python で計算 #

1
2
3
4
5
from sklearn.metrics import mean_pinball_loss

quantile = 0.9
loss = mean_pinball_loss(y_true, y_pred_quantile, alpha=quantile)
print(f"Pinball Loss (q={quantile}): {loss:.4f}")

alpha に分位点を指定し、分位点回帰モデルの出力（例：GradientBoostingRegressor の quantile 損失）と組み合わせて評価します。

計算例 #

$\tau = 0.9$ で実測値 $y = 100$、予測値 $\hat{y} = 90$ の場合、

$$ L_{0.9}(100, 90) = 0.9 \times (100 - 90) = 9.0 $$

逆に過大予測 $\hat{y} = 110$ の場合は、

$$ L_{0.9}(100, 110) = (1 - 0.9) \times (110 - 100) = 1.0 $$

同じ 10 の誤差でも、$\tau = 0.9$ では過小予測を 9 倍厳しく罰します。$\tau = 0.5$ ではどちらも $0.5 \times 10 = 5.0$ となり、MAE と一致します。

3. 解釈 #

小さいほど良い：分位点が目標とする位置に近づいている。
α=0.5 の場合は MAE と同じになる。
左右非対称のペナルティ：上振れと下振れでペナルティが異なるため、リスク回避の度合いを調整できる。

4. 実務での活用 #

需要予測の予測区間：安全在庫のために 90% 分位点を評価。
リスク管理：Value at Risk (VaR) など金融リスク指標の評価。
エネルギー負荷予測：上限・下限の予測ラインを別々に学習し、ピンボール損失で性能を確認。

5. 注意点 #

分位点ごとにモデルを訓練する必要があるため、複数の quantile を出力するモデル（LightGBM の quantile モードなど）が便利。
分位点が 0 や 1 に近いほど外れ値に敏感になるため、サンプル数が十分に必要。
ピンボール損失だけでなく、PICP（Prediction Interval Coverage Probability）などと併用すると、区間の信頼性を総合的に評価できる。

まとめ #

ピンボール損失は分位点回帰の基本指標で、上振れ・下振れの誤差を非対称に評価する。
mean_pinball_loss で容易に計算でき、リスク回避の度合いに応じて分位点を設定可能。
予測区間を扱うタスクでは、ピンボール損失と PICP を組み合わせて性能をチェックしよう。

PICP — 予測区間のカバレッジ
平均バイアス誤差 — バイアスの方向を確認
MAE・RMSE — 点予測の誤差指標

ノイズと各指標の変化 #

ノイズ量を変えた場合の各指標の変化を確認できます。