Resume la distribución con diagramas de caja

Visualize

Resume la distribución con diagramas de caja

Creado: Última actualización: Tiempo de lectura: 1 min

Un diagrama de caja es un recurso básico para mostrar la mediana, los cuartiles y los valores atípicos en un solo trazo. Al comparar categorías, las diferencias de dispersión se hacen evidentes al instante.

import seaborn as sns
import matplotlib.pyplot as plt

mpg = sns.load_dataset("mpg").dropna(subset=["mpg", "origin"])

fig, ax = plt.subplots(figsize=(6, 4))
sns.boxplot(data=mpg, x="origin", y="mpg", palette="Set2", ax=ax)

ax.set_xlabel("Región de producción")
ax.set_ylabel("Rendimiento de combustible (MPG)")
ax.set_title("Rendimiento por región (diagrama de caja)")
ax.grid(axis="y", alpha=0.3)

fig.tight_layout()
fig.savefig("static/images/visualize/distribution/boxplot.svg")

Al comparar categorías se aprecian las diferencias de varianza.

Pautas de lectura #

  • La caja representa el rango intercuartílico (IQR) y la línea central es la mediana. Los bigotes suelen abarcar 1.5×IQR.
  • Si aparecen demasiados valores atípicos, conviene revisarlos en otra gráfica o ajustar el límite superior.
  • Girar el diagrama en horizontal ayuda cuando las etiquetas son largas.