4.2.3
MAE & RMSE
Ringkasan
- MAE dan RMSE mengukur besarnya galat regresi dengan formulasi absolut dan kuadrat.
- Lihat bagaimana kedua metrik merespons ketika prediksi mengandung outlier.
- Ringkas kriteria pemilihan: sensitivitas terhadap outlier, kemudahan interpretasi, dan kesesuaian unit.
1. Definisi dan karakteristik #
Untuk pengamatan \(y_i\) dan prediksi \(\hat{y}_i\):
$$ \mathrm{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|, \qquad \mathrm{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2} $$- MAE merata-rata galat absolut. Lebih tahan terhadap outlier dan sejalan dengan median pada distribusi Laplace.
- RMSE mengkuadratkan galat sebelum dirata-ratakan lalu mengambil akar, sehingga galat besar dihukum lebih berat.
- Keduanya mempertahankan satuan aslinya; RMSE menonjolkan galat besar, MAE menggambarkan galat rata-rata.
2. Menghitung di Python #
| |
Gunakan squared=False agar mean_squared_error mengembalikan RMSE.
3. Dampak outlier #
| |
- MAE hanya naik sedikit ketika ditambah outlier.
- RMSE meningkat drastis, menandai galat besar secara tajam.
4. Memilih metrik #
- Outlier sedikit, presisi penting → pilih RMSE untuk menonjolkan deviasi halus.
- Outlier banyak atau distribusi berekor → MAE (atau MAD) lebih stabil.
- Biaya berskala kuadrat → RMSE sejalan dengan fungsi biaya bisnis.
- Perlu komunikasi langsung dalam satuan asli → MAE menjawab “rata-rata menyimpang ±X satuan”.
5. Metrik terkait #
- MAPE: galat persentase; mudah dipahami bisnis, namun tidak stabil dekat nol.
- RMSLE: RMSE dalam skala log; menghukum underestimation pada prediksi pertumbuhan.
- Pinball loss: mengevaluasi interval/kantil untuk skenario sensitif terhadap risiko.
Ringkasan #
- MAE dan RMSE saling melengkapi: yang satu tangguh, yang lain peka terhadap galat besar.
- Sajikan keduanya untuk memahami distribusi galat dan selaraskan pilihan metrik dengan fungsi biaya.
- Lengkapi dengan MAPE, RMSLE, atau metrik lain guna memperoleh gambaran performa yang komprehensif.