Ringkas distribusi dengan box plot

Visualize

Ringkas distribusi dengan box plot

Dibuat: Pembaruan terakhir: Waktu baca: 1 menit

Box plot adalah grafik andalan untuk menampilkan median, kuartil, dan outlier dalam satu simbol. Membandingkan tiap kategori langsung memperlihatkan perbedaan sebaran.

import seaborn as sns
import matplotlib.pyplot as plt

mpg = sns.load_dataset("mpg").dropna(subset=["mpg", "origin"])

fig, ax = plt.subplots(figsize=(6, 4))
sns.boxplot(data=mpg, x="origin", y="mpg", palette="Set2", ax=ax)

ax.set_xlabel("Wilayah produksi")
ax.set_ylabel("Efisiensi bahan bakar (MPG)")
ax.set_title("Box plot efisiensi per wilayah")
ax.grid(axis="y", alpha=0.3)

fig.tight_layout()
fig.savefig("static/images/visualize/distribution/boxplot.svg")

Membandingkan kategori memperlihatkan perbedaan varians.

Tips membaca #

  • Kotak mewakili rentang interkuartil (IQR) dan garis di tengah adalah median. Whisker biasanya diperpanjang hingga 1,5×IQR.
  • Jika outlier terlalu banyak, periksa dengan grafik lain atau longgarkan batas atasnya.
  • Memutar plot ke orientasi horizontal membuat label yang panjang tetap mudah dibaca.