4.2.3
MAE y RMSE
Resumen
- MAE y RMSE cuantifican la magnitud del error en regresión con formulaciones absolutas y cuadráticas.
- Visualiza cómo responden las métricas cuando aparecen outliers en las predicciones.
- Resume criterios de elección: sensibilidad a outliers, interpretabilidad y unidades.
1. Definiciones y propiedades #
Para observaciones \(y_i\) y predicciones \(\hat{y}_i\):
$$ \mathrm{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|, \qquad \mathrm{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2} $$- MAE promedia los errores absolutos. Es más robusto frente a outliers y se relaciona con la media de una distribución Laplace.
- RMSE eleva al cuadrado los errores antes de promediarlos y toma la raíz cuadrada, castigando con fuerza los desvíos grandes.
- Ambas métricas mantienen las unidades originales de la variable objetivo; RMSE enfatiza errores grandes, MAE mide el error típico.
2. Cálculo en Python #
| |
Con squared=False obtenemos RMSE en lugar de MSE.
3. Comparación con outliers #
| |
- MAE apenas aumenta cuando añadimos un outlier.
- RMSE se dispara, señalando con claridad los errores grandes.
4. Cómo elegir #
- Pocos outliers y necesidad de precisión → usa RMSE para resaltar desviaciones sutiles.
- Muchos outliers o colas pesadas → MAE (o MAD) se mantiene estable.
- Costes cuadráticos → RMSE se alinea con el objetivo empresarial (energía, desviaciones físicas).
- Necesitas comunicar en unidades reales → MAE responde “en promedio nos desviamos ±X unidades”.
5. Métricas relacionadas #
- MAPE: error porcentual, intuitivo para negocio pero inestable cerca de cero.
- RMSLE: RMSE en escala logarítmica; penaliza la infraestimación en previsiones de crecimiento.
- Pinball loss: evalúa intervalos o cuantiles cuando existen objetivos de riesgo.
Resumen #
- MAE y RMSE se complementan: uno es robusto, el otro sensible a errores grandes.
- Reporta ambos para entender la distribución de errores y elige la métrica acorde a los costes.
- Acompáñalos con MAPE, RMSLE u otras métricas para obtener una visión completa del desempeño del modelo.