Kontur kepadatan 2D dengan KDE

Visualize

Kontur kepadatan 2D dengan KDE

Dibuat: Pembaruan terakhir: Waktu baca: 1 menit

Dengan seaborn.kdeplot kita dapat menggambar kepadatan gabungan dua variabel sebagai kontur atau area berwarna. Teknik ini berguna ketika scatter plot terlalu padat.

import seaborn as sns
import matplotlib.pyplot as plt

penguins = sns.load_dataset("penguins").dropna(subset=["bill_length_mm", "bill_depth_mm"])

fig, ax = plt.subplots(figsize=(5.5, 4.5))
sns.kdeplot(
    data=penguins,
    x="bill_length_mm",
    y="bill_depth_mm",
    hue="species",
    fill=True,
    thresh=0.05,
    levels=6,
    alpha=0.6,
    ax=ax,
)

ax.set_xlabel("Panjang paruh (mm)")
ax.set_ylabel("Kedalaman paruh (mm)")
ax.set_title("KDE 2D per spesies penguin")
ax.grid(alpha=0.2)

fig.tight_layout()
fig.savefig("static/images/visualize/distribution/kde2d.svg")

Saat scatter plot terlalu ramai, KDE 2D menonjolkan area yang padat.

Tips membaca #

  • Kontur yang rapat menunjukkan area yang lebih padat, dan tingkat kegelapan warnanya membantu memahami frekuensi secara intuitif.
  • Sesuaikan thresh untuk mengabaikan kontur berkepadatan sangat kecil agar visual tetap bersih.
  • Pada data berukuran besar, KDE bisa berat; pertimbangkan sampling atau atur bw_adjust guna mengendalikan bandwidth.