Visualiza la distribución acumulada con ECDF

Visualize

Visualiza la distribución acumulada con ECDF

Creado: Última actualización: Tiempo de lectura: 1 min

La función de distribución acumulada empírica (ECDF) muestra de forma sencilla qué proporción de observaciones cae por debajo de un valor dado. Es muy útil para fijar umbrales.

import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)

ax.set_xlabel("Total de la cuenta ($)")
ax.set_ylabel("Proporción acumulada")
ax.set_title("ECDF del total de la cuenta")
ax.grid(alpha=0.2)

fig.tight_layout()
fig.savefig("static/images/visualize/distribution/ecdf.svg")

Ideal para justificar umbrales, por ejemplo qué porcentaje está por debajo de 30 dólares.

Pautas de lectura #

  • Los tramos con pendiente pronunciada indican que muchas muestras se concentran allí; los más planos muestran valores dispersos.
  • Expresiones como «el 80 % de los clientes gasta menos de 30 $» se respaldan con facilidad.
  • Si comparas muchas series, limita la cantidad de colores y apóyate en la leyenda y el tipo de línea para mantener la legibilidad.