ECDF สำหรับดูการสะสมของค่า

Visualize

ECDF สำหรับดูการสะสมของค่า

Created: Last updated: Read time: 1 min

ECDF (Empirical Cumulative Distribution Function) บอกสัดส่วนของตัวอย่างที่มีค่าน้อยกว่าหรือเท่ากับเกณฑ์ที่กำหนด เหมาะมากสำหรับการตั้ง threshold

import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")

fig, ax = plt.subplots(figsize=(6, 4))
sns.ecdfplot(data=tips, x="total_bill", hue="time", ax=ax)

ax.set_xlabel("ยอดบิล ($)")
ax.set_ylabel("สัดส่วนสะสม")
ax.set_title("ECDF ของยอดบิล")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

ECDF ของยอดบิลแยกตามช่วงเวลา

วิธีอ่าน #

  • ช่วงที่เส้นชันหมายถึงค่าจำนวนมากอัดอยู่บริเวณนั้น ส่วนช่วงที่ค่อยๆ ไต่บอกว่าค่ากระจาย
  • อ่านข้อสรุปเช่น “80% ของลูกจ่ายไม่เกิน 30 ดอลลาร์” ได้ทันที
  • เมื่อมีหลายซีรีส์ ให้จำกัดจำนวนสีและใช้รูปแบบเส้นช่วยแยกความต่าง