Visualiza la distribución acumulada con ECDF

6.2.7

Visualiza la distribución acumulada con ECDF

Actualizado 2020-04-22 Lectura 1 min

La función de distribución acumulada empírica (ECDF) muestra de forma sencilla qué proporción de observaciones cae por debajo de un valor dado. Es muy útil para fijar umbrales.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)

ax.set_xlabel("Total de la cuenta ($)")
ax.set_ylabel("Proporción acumulada")
ax.set_title("ECDF del total de la cuenta")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Ideal para justificar umbrales, por ejemplo qué porcentaje está por debajo de 30 dólares.

Pautas de lectura #

  • Los tramos con pendiente pronunciada indican que muchas muestras se concentran allí; los más planos muestran valores dispersos.
  • Expresiones como «el 80 % de los clientes gasta menos de 30 $» se respaldan con facilidad.
  • Si comparas muchas series, limita la cantidad de colores y apóyate en la leyenda y el tipo de línea para mantener la legibilidad.