La función de distribución acumulada empírica (ECDF) muestra de forma sencilla qué proporción de observaciones cae por debajo de un valor dado. Es muy útil para fijar umbrales.
import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")
fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)
ax.set_xlabel("Total de la cuenta ($)")
ax.set_ylabel("Proporción acumulada")
ax.set_title("ECDF del total de la cuenta")
ax.grid(alpha=0.2)
fig.tight_layout()
fig.savefig("static/images/visualize/distribution/ecdf.svg")
Pautas de lectura #
- Los tramos con pendiente pronunciada indican que muchas muestras se concentran allí; los más planos muestran valores dispersos.
- Expresiones como «el 80 % de los clientes gasta menos de 30 $» se respaldan con facilidad.
- Si comparas muchas series, limita la cantidad de colores y apóyate en la leyenda y el tipo de línea para mantener la legibilidad.