中央値絶対誤差(Median Absolute Error)

Eval

中央値絶対誤差(Median Absolute Error)

作成日: 最終更新: 読了時間: 1 分
まとめ
  • Median Absolute Error は絶対誤差の中央値で外れ値に頑健な指標です。
  • 外れ値を含むデータで MAE と中央値誤差を比較し、差を可視化します。
  • 報告時の解釈や単位の扱いに関する注意点を整理します。

1. 定義 #

観測値を \(y_i\)、予測値を \(\hat{y}_i\) とすると、 $$ \mathrm{MedAE} = \mathrm{median}(|y_i - \hat{y}_i|) $$ 平均(MAE)ではなく中央値を用いるため、極端な外れ値に影響されにくいのが特徴です。


2. Python で計算 #

from sklearn.metrics import median_absolute_error

medae = median_absolute_error(y_test, y_pred)
print(f"Median Absolute Error: {medae:.3f}")

scikit-learn の median_absolute_error で簡単に算出できます。MAE よりも堅牢な指標が欲しいときの第一候補です。


3. MedAE と MAE の比較 #

  • 外れ値への強さ:MAE は外れ値が多いと数値が大きく押し上げられるが、MedAE は中央値なので変化が緩やか。
  • 解釈:「誤差の典型値」に近い感覚で理解できる。50% のサンプルは MedAE 以下の誤差に収まる。
  • 分布の偏り:左右非対称な誤差分布でも堅牢に評価できる。

4. 実務での活用 #

  • 住宅価格や賃料予測:外れ値が混在する価格データの評価指標として便利。

  • センサー値の予測:稀に大きなノイズが混じる環境で、典型的な誤差を把握する。

  • メディアンベースの報告:ビジネスレポートで「中央値誤差 xx 」と記載すると、意思決定者にも直感的に伝わる。


5. 他指標と併用 #

指標特徴用途
MAE平均誤差。解釈が容易一般的な誤差指標
MedAE中央値誤差。外れ値に強いノイズの多いデータ
RMSE大きな誤差を重視外れ値も評価に反映したい時

まとめ #

  • MedAE は外れ値の影響を抑えて典型的な誤差を示すロバストな指標。

  • median_absolute_error で容易に計算でき、MAE や RMSE と合わせて報告すると誤差の全体像が見えやすい。

  • ノイズの多い現場データでは、モデル評価の基準として積極的に活用しよう。