Visualisasikan distribusi kumulatif dengan ECDF

6.2.7

Visualisasikan distribusi kumulatif dengan ECDF

Diperbarui 2020-04-22 Baca 1 menit

Empirical cumulative distribution function (ECDF) adalah grafik sederhana untuk menunjukkan porsi sampel yang berada di bawah suatu nilai. Sangat berguna ketika kita perlu menetapkan ambang.

import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)

ax.set_xlabel("Total tagihan ($)")
ax.set_ylabel("Porsi kumulatif")
ax.set_title("ECDF total tagihan")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Mudah dipakai untuk membaca ambang, misalnya berapa persen yang di bawah $30.

Tips membaca #

  • Bagian kurva yang curam menandakan data menumpuk, sedangkan bagian datar berarti nilainya tersebar.
  • Kalimat seperti “80% pelanggan membayar kurang dari $30” dapat dibuktikan dengan cepat.
  • Jika seri yang dibandingkan banyak, batasi jumlah warna dan gunakan legenda serta gaya garis agar tetap jelas.