Dengan seaborn.kdeplot kita dapat menggambar kepadatan gabungan dua variabel sebagai kontur atau area berwarna. Teknik ini berguna ketika scatter plot terlalu padat.
import seaborn as sns
import matplotlib.pyplot as plt
penguins = sns.load_dataset("penguins").dropna(subset=["bill_length_mm", "bill_depth_mm"])
fig, ax = plt.subplots(figsize=(5.5, 4.5))
sns.kdeplot(
data=penguins,
x="bill_length_mm",
y="bill_depth_mm",
hue="species",
fill=True,
thresh=0.05,
levels=6,
alpha=0.6,
ax=ax,
)
ax.set_xlabel("Panjang paruh (mm)")
ax.set_ylabel("Kedalaman paruh (mm)")
ax.set_title("KDE 2D per spesies penguin")
ax.grid(alpha=0.2)
fig.tight_layout()
fig.savefig("static/images/visualize/distribution/kde2d.svg")
Tips membaca #
- Kontur yang rapat menunjukkan area yang lebih padat, dan tingkat kegelapan warnanya membantu memahami frekuensi secara intuitif.
- Sesuaikan
threshuntuk mengabaikan kontur berkepadatan sangat kecil agar visual tetap bersih. - Pada data berukuran besar, KDE bisa berat; pertimbangkan sampling atau atur
bw_adjustguna mengendalikan bandwidth.