Visualisasikan distribusi kumulatif dengan ECDF

Visualize

Visualisasikan distribusi kumulatif dengan ECDF

Dibuat: Pembaruan terakhir: Waktu baca: 1 menit

Empirical cumulative distribution function (ECDF) adalah grafik sederhana untuk menunjukkan porsi sampel yang berada di bawah suatu nilai. Sangat berguna ketika kita perlu menetapkan ambang.

import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)

ax.set_xlabel("Total tagihan ($)")
ax.set_ylabel("Porsi kumulatif")
ax.set_title("ECDF total tagihan")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Mudah dipakai untuk membaca ambang, misalnya berapa persen yang di bawah $30.

Tips membaca #

  • Bagian kurva yang curam menandakan data menumpuk, sedangkan bagian datar berarti nilainya tersebar.
  • Kalimat seperti “80% pelanggan membayar kurang dari $30” dapat dibuktikan dengan cepat.
  • Jika seri yang dibandingkan banyak, batasi jumlah warna dan gunakan legenda serta gaya garis agar tetap jelas.