まとめ
- La varianza explicada cuantifica la fracción de variabilidad del objetivo que el modelo reproduce.
- Calcula la métrica junto a R² para ver cómo influyen el ruido y el sesgo en cada indicador.
- Entiende cuándo aporta información y cuándo puede resultar engañosa.
1. Definición #
Con \(\mathrm{Var}(y)\) la varianza de las observaciones y \(\mathrm{Var}(y - \hat{y})\) la varianza de los residuos:
$$ \mathrm{Varianza\ explicada} = 1 - \frac{\mathrm{Var}(y - \hat{y})}{\mathrm{Var}(y)} $$
- Valores cercanos a 1 indican que casi toda la variabilidad está capturada.
- 0 equivale a predecir siempre la media.
- Valores negativos significan que la predicción es peor que usar la media.
2. Cálculo en Python #
from sklearn.metrics import explained_variance_score
ev = explained_variance_score(y_test, y_pred)
print(f"Varianza explicada: {ev:.3f}")
explained_variance_score soporta regresión multi-salida con multioutput="raw_values".
3. Diferencias frente a R² #
- Sensibilidad al sesgo: R² reacciona al sesgo porque incluye el error cuadrático medio; la varianza explicada ignora el sesgo y se centra en la dispersión.
- Cuándo usarlo: cuando interesa capturar la variabilidad (la “forma” de la serie) más que el nivel exacto.
- Reporte: complétalo con R² para mostrar tanto la variabilidad cubierta como el ajuste global.
4. Casos de uso #
- Pronósticos de riesgo/volatilidad: verifica si el modelo recoge las fluctuaciones alrededor del objetivo.
- Regresión multi-output: compara la varianza explicada por salida y detecta objetivos difíciles.
- Necesidad de corregir sesgo: una varianza explicada alta con MAE elevado indica que falta ajustar el nivel; corrige interceptos.
5. Métricas complementarias #
| Métrica | Enfoque | Comentario |
|---|---|---|
| R² | Ajuste global | Sensible a sesgo y varianza |
| Varianza explicada | Captura de variabilidad | Insensible al desplazamiento medio |
| MAE / RMSE | Error absoluto | Mide la desviación real |
Resumen #
- La varianza explicada es un buen complemento de R² porque aísla la capacidad del modelo para reproducir la variabilidad.
- Se calcula fácilmente con
explained_variance_score, incluso en tareas multi-output. - Interprétala junto con métricas sensibles al sesgo (MAE, MBE) para obtener una visión equilibrada.