まとめ
- Median Absolute Error は絶対誤差の中央値で外れ値に頑健な指標です。
- 外れ値を含むデータで MAE と中央値誤差を比較し、差を可視化します。
- 報告時の解釈や単位の扱いに関する注意点を整理します。
1. 定義 #
観測値を \(y_i\)、予測値を \(\hat{y}_i\) とすると、 $$ \mathrm{MedAE} = \mathrm{median}(|y_i - \hat{y}_i|) $$ 平均(MAE)ではなく中央値を用いるため、極端な外れ値に影響されにくいのが特徴です。
2. Python で計算 #
from sklearn.metrics import median_absolute_error
medae = median_absolute_error(y_test, y_pred)
print(f"Median Absolute Error: {medae:.3f}")
scikit-learn の median_absolute_error で簡単に算出できます。MAE よりも堅牢な指標が欲しいときの第一候補です。
3. MedAE と MAE の比較 #
- 外れ値への強さ:MAE は外れ値が多いと数値が大きく押し上げられるが、MedAE は中央値なので変化が緩やか。
- 解釈:「誤差の典型値」に近い感覚で理解できる。50% のサンプルは MedAE 以下の誤差に収まる。
- 分布の偏り:左右非対称な誤差分布でも堅牢に評価できる。
4. 実務での活用 #
住宅価格や賃料予測:外れ値が混在する価格データの評価指標として便利。
センサー値の予測:稀に大きなノイズが混じる環境で、典型的な誤差を把握する。
メディアンベースの報告:ビジネスレポートで「中央値誤差 xx 」と記載すると、意思決定者にも直感的に伝わる。
5. 他指標と併用 #
| 指標 | 特徴 | 用途 |
|---|---|---|
| MAE | 平均誤差。解釈が容易 | 一般的な誤差指標 |
| MedAE | 中央値誤差。外れ値に強い | ノイズの多いデータ |
| RMSE | 大きな誤差を重視 | 外れ値も評価に反映したい時 |
まとめ #
MedAE は外れ値の影響を抑えて典型的な誤差を示すロバストな指標。
median_absolute_errorで容易に計算でき、MAE や RMSE と合わせて報告すると誤差の全体像が見えやすい。ノイズの多い現場データでは、モデル評価の基準として積極的に活用しよう。