Ringkas distribusi dengan box plot

6.2.5

Ringkas distribusi dengan box plot

Diperbarui 2020-03-25 Baca 1 menit

Box plot adalah grafik andalan untuk menampilkan median, kuartil, dan outlier dalam satu simbol. Membandingkan tiap kategori langsung memperlihatkan perbedaan sebaran.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import seaborn as sns
import matplotlib.pyplot as plt

mpg = sns.load_dataset("mpg").dropna(subset=["mpg", "origin"])

fig, ax = plt.subplots(figsize=(6, 4))
sns.boxplot(data=mpg, x="origin", y="mpg", palette="Set2", ax=ax)

ax.set_xlabel("Wilayah produksi")
ax.set_ylabel("Efisiensi bahan bakar (MPG)")
ax.set_title("Box plot efisiensi per wilayah")
ax.grid(axis="y", alpha=0.3)

fig.tight_layout()

plt.show()

Membandingkan kategori memperlihatkan perbedaan varians.

Tips membaca #

  • Kotak mewakili rentang interkuartil (IQR) dan garis di tengah adalah median. Whisker biasanya diperpanjang hingga 1,5×IQR.
  • Jika outlier terlalu banyak, periksa dengan grafik lain atau longgarkan batas atasnya.
  • Memutar plot ke orientasi horizontal membuat label yang panjang tetap mudah dibaca.