5.10.1
モデル × 前処理 × データ特性の精度比較
まとめ
- 6 種類の合成データ × 4 つの前処理 × 5 つの予測モデル = 120 通りのパイプラインを体系的に比較する。
- MASE ヒートマップで「どのデータ特性にどの組み合わせが強いか」を俯瞰する。
- 集計指標では見えない残差の偏りや自己相関を分析し、モデル改善の方向を見極める。
- ウォークフォワード検証 — 時系列における正しい評価手法
- MASE — 季節ナイーブをベースラインとするスケールフリー指標
- 指数平滑法 — 比較対象モデルの基礎
個々のモデルを単体で試すだけでは「このデータに最適な予測パイプライン」は見えてこない。ここでは、データの特性・前処理・モデルの 3 軸を同時に動かし、120 通りの組み合わせを一括で比較する。
1. 合成データの生成 #
まず、実務で遭遇する代表的な 6 パターンの時系列を合成する。すべて月次・72 か月(6 年分)で、末尾 12 か月をテストに使う。
| |
各データの特徴は以下のとおり。
| データ | 特徴 | 難しい点 |
|---|---|---|
| 線形トレンド | 右肩上がり、季節性なし | トレンド成分だけ正しく捉えればよい |
| 加法季節 | 振幅一定の周期パターン | 季節性の位相とレベルの推定 |
| 乗法季節 | 値が大きくなるほど振幅拡大 | 加法モデルでは振幅を過小評価する |
| 構造変化 | 途中でレベルが急変 | 変化前のデータが予測を歪める |
| 間欠需要 | ゼロが 75% を占める | 連続値モデルの前提が崩れる |
| 複合 | トレンド + 季節 + 自己相関 | 全成分を同時に捉える必要がある |
2. パイプラインの定義 #
前処理・モデル・評価を統一的に回すためのヘルパー関数を定義する。
| |
3. 全パイプラインの実行 #
120 通りの組み合わせを一括で実行し、MASE を収集する。前処理とモデルの組み合わせによっては失敗するケースがあるため、try/except で NaN を記録する。
| |
4. MASE ヒートマップ #
120 セルを一枚のヒートマップに描く。行がデータ種別、列が「前処理 + モデル」の組み合わせ。MASE が 1 未満なら季節ナイーブより優秀で、セルが濃い青ほど精度が高い。
| |
読み方のポイント #
- MASE < 1(緑系)のセルは季節ナイーブより優秀。値が小さいほど良い。
- MASE > 1(赤系)のセルは季節ナイーブに負けている。前処理やモデルの選択を再考すべき。
- 横方向に比較すると「同じデータに対してどのパイプラインが効くか」がわかる。
- 縦方向に比較すると「同じパイプラインがデータ特性によってどう変わるか」がわかる。
- 「なし + 季節ナイーブ」列は定義上 MASE = 1.0 になる。他のセルはこの列との相対評価として読める。
5. 誤差パターン分析 #
集計指標(MASE)だけでは見えない残差の構造を分析する。ここでは代表的な 3 ケースを取り上げ、予測 vs 実測と残差の自己相関を確認する。
| |
残差から読み取れること #
- HW加法:季節性をモデルに含むため残差にパターンが残りにくい。MBE が 0 に近ければバイアスもない。
- SES:季節成分を無視するため、残差に明確な周期パターン(ACF のラグ 12 付近にスパイク)が残る。MASE が高いだけでなく、予測に系統的な偏りがある。
- 差分 + ARIMA:差分で定常化してから ARIMA を適用。逆変換の誤差伝播で精度が落ちることがあり、残差の ACF でその影響を確認できる。
6. まとめと実務への応用 #
| データ特性 | 有効な前処理 | 有効なモデル | 理由 |
|---|---|---|---|
| 線形トレンドのみ | なし / 差分 | ARIMA, HW加法 | 差分 or トレンド成分で対処 |
| 加法季節 | なし | HW加法 | 加法季節をそのままモデル化 |
| 乗法季節 | 対数 / Box-Cox | HW乗法 | 変換で加法的に扱えるようになる |
| 構造変化 | なし | HW加法, ARIMA | 変化後のデータに重みが集まるモデルが有利 |
| 間欠需要 | なし | 季節ナイーブ | 連続値モデルは苦戦する |
| 複合パターン | なし | HW加法, ARIMA | 季節性 + 自己相関の両方を捉える |
MASE < 1 が「季節ナイーブに勝った」ことを意味する。この基準を超えられないモデルは、そのデータに対しては複雑さに見合う精度を出せていない。
7. よくある失敗パターン #
- 乗法モデルに非正値データを渡す: HW乗法は値が 0 以下だとエラーになる。間欠需要のようにゼロを含むデータには対数変換か加法モデルを使う。
- 過剰な差分: もともと定常に近いデータを差分するとノイズが増幅される。ADF 検定で定常性を確認してから差分を適用する。
- 残差の自己相関を無視する: MASE が低くても残差に周期的なパターンが残っていれば、モデルが系列の構造を取りこぼしている。ACF プロットで必ず確認する。
- 間欠需要に MAPE を使う: ゼロ除算でエラーになるか、値が極端に膨らむ。MASE やピンボールロスなど代替指標を使う。
- ウォークフォワード検証 — 時系列に適した交差検証手法
- MASE — スケールフリーな予測精度指標
- ARIMA モデル — 自己回帰と移動平均の組み合わせ
- ホルト・ウィンター法 — トレンドと季節性の平滑化
- ETS モデル — 誤差・トレンド・季節性の分離