Visualisasikan distribusi kumulatif dengan ECDF

6.2.7

Visualisasikan distribusi kumulatif dengan ECDF

Diperbarui 2020-04-22 Baca 1 menit

Empirical cumulative distribution function (ECDF) adalah grafik sederhana untuk menunjukkan porsi sampel yang berada di bawah suatu nilai. Sangat berguna ketika kita perlu menetapkan ambang.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)

ax.set_xlabel("Total tagihan ($)")
ax.set_ylabel("Porsi kumulatif")
ax.set_title("ECDF total tagihan")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Mudah dipakai untuk membaca ambang, misalnya berapa persen yang di bawah $30.

Tips membaca #

  • Bagian kurva yang curam menandakan data menumpuk, sedangkan bagian datar berarti nilainya tersebar.
  • Kalimat seperti “80% pelanggan membayar kurang dari $30” dapat dibuktikan dengan cepat.
  • Jika seri yang dibandingkan banyak, batasi jumlah warna dan gunakan legenda serta gaya garis agar tetap jelas.