แสดงการกระจายด้วยกล่องสี่ส่วน

Visualize

แสดงการกระจายด้วยกล่องสี่ส่วน

Created: Last updated: Read time: 1 min

Boxplot เป็นกราฟมาตรฐานที่สรุปค่ามัธยฐาน ควอร์ไทล์ และค่าผิดปกติไว้ในเส้นชุดเดียว เมื่อนำมาจัดเรียงตามหมวดหมู่ จะเห็นความแตกต่างของการกระจายได้ชัด

import seaborn as sns
import matplotlib.pyplot as plt

mpg = sns.load_dataset("mpg").dropna(subset=["mpg", "origin"])

fig, ax = plt.subplots(figsize=(6, 4))
sns.boxplot(data=mpg, x="origin", y="mpg", palette="Set2", ax=ax)

ax.set_xlabel("ภูมิภาคที่ผลิต")
ax.set_ylabel("อัตราสิ้นเปลือง (MPG)")
ax.set_title("boxplot อัตราสิ้นเปลืองแยกตามภูมิภาค")
ax.grid(axis="y", alpha=0.3)

fig.tight_layout()

plt.show()

boxplot เปรียบเทียบอัตราสิ้นเปลืองตามภูมิภาค

วิธีอ่าน #

  • กล่องคือช่วง IQR (Q1–Q3) เส้นกลางคือค่ามัธยฐาน และหนวดโดยมากยาว 1.5×IQR
  • หาก outlier เยอะจนรบกวน ให้ตรวจในกราฟย่อยหรือจำกัดช่วง y-axis
  • หมุนกราฟเป็นแนวนอนเมื่อป้ายชื่อยาวหรืออ่านยากในแนวตั้ง