まとめ
- RMSLE aplica RMSE sobre valores logarítmicos, destacando diferencias relativas o porcentuales.
- Útil cuando la infraestimación es más costosa que la sobreestimación, como en demanda o métricas de crecimiento.
- Ten en cuenta precauciones con ceros y valores negativos antes de usarlo.
1. Definición #
$$ \mathrm{RMSLE} = \sqrt{\frac{1}{n} \sum_{i=1}^n \left( \log(1 + \hat{y}_i) - \log(1 + y_i) \right)^2 } $$
- Al sumar 1 admitimos observaciones cero; los valores negativos siguen siendo inválidos.
- Errores con la misma proporción aportan el mismo peso (ej. 10↔20 y 100↔200).
2. Cálculo en Python #
from sklearn.metrics import mean_squared_log_error
rmsle = mean_squared_log_error(y_test, y_pred, squared=False)
print(f"RMSLE = {rmsle:.3f}")
mean_squared_log_error lanza error si hay valores negativos; limpia o desplaza la serie antes.
3. Cuándo usar RMSLE #
- Pronóstico de demanda/ventas: evita infraestimaciones que pueden provocar roturas de stock.
- Métricas de crecimiento (tráfico, población, instalaciones): importa más la variación relativa que la absoluta.
- Objetivos no negativos: aplica sólo cuando los valores son ≥ 0.
4. Intuición y precauciones #
- Reproduce una sensación de “error porcentual” manteniendo unidades comparables.
- Penaliza algo más la infraestimación debido a la asimetría logarítmica.
- Con valores muy pequeños, considera fijar un umbral mínimo antes de entrenar.
5. Comparativa #
| Métrica | Enfoque | Precaución |
|---|---|---|
| RMSE | Error cuadrático absoluto | Dominado por magnitudes grandes |
| MAE | Error absoluto robusto | Ignora la perspectiva relativa |
| RMSLE | Error relativo/proporcional | No definido para negativos |
Resumen #
- RMSLE mezcla RMSE con escalado logarítmico para enfatizar la exactitud relativa y penalizar la infraestimación.
- Es sencillo de calcular, pero requiere datos no negativos.
- Complétalo con MAE o RMSE para equilibrar interpretación relativa y absoluta.