ฮิสโตแกรม

Visualize

ฮิสโตแกรม

ฮิสโตแกรมบอกว่าแต่ละช่วงค่ามีข้อมูลกี่จุด จึงช่วยให้เห็นการกระจายของตัวเลขอย่างง่าย

import matplotlib.pyplot as plt
import seaborn as sns

df = sns.load_dataset("iris")
fig, ax = plt.subplots(figsize=(6, 4))
sns.histplot(data=df, x="sepal_length", binwidth=0.5, color="#2563eb", ax=ax)
ax.set_xlabel("ความยาวกลีบเลี้ยง (ซม.)")
ax.set_ylabel("ความถี่")
ax.set_title("ฮิสโตแกรมข้อมูล Iris")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

ฮิสโตแกรมของความยาวกลีบเลี้ยง

วิธีอ่าน #

  • ปรับความกว้างของถัง (bin width) ให้เหมาะกับโจทย์ เพราะค่าที่ต่างกันจะทำให้รูปทรงเปลี่ยนมาก
  • ถ้าข้อมูล偏ไปด้านใดด้านหนึ่ง ใช้แกนลอการิทึมหรือหยิบช่วงที่สนใจมาขยาย
  • ซ้อน KDE หรือ rugplot เพิ่มเพื่อดูแนวโน้มต่อเนื่องควบคู่กับฮิสโตแกรม