Empirical cumulative distribution function (ECDF) adalah grafik sederhana untuk menunjukkan porsi sampel yang berada di bawah suatu nilai. Sangat berguna ketika kita perlu menetapkan ambang.
import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")
fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)
ax.set_xlabel("Total tagihan ($)")
ax.set_ylabel("Porsi kumulatif")
ax.set_title("ECDF total tagihan")
ax.grid(alpha=0.2)
fig.tight_layout()
plt.show()

Tips membaca #
- Bagian kurva yang curam menandakan data menumpuk, sedangkan bagian datar berarti nilainya tersebar.
- Kalimat seperti “80% pelanggan membayar kurang dari $30” dapat dibuktikan dengan cepat.
- Jika seri yang dibandingkan banyak, batasi jumlah warna dan gunakan legenda serta gaya garis agar tetap jelas.