สแคตเตอร์เมทริกซ์เทียบทุกคู่ตัวแปร

Visualize

สแคตเตอร์เมทริกซ์เทียบทุกคู่ตัวแปร

Created: Last updated: Read time: 1 min

seaborn.pairplot วาดสแคตเตอร์ของทุกคู่ตัวแปรพร้อมกับฮิสโตแกรมบนแนวทแยง ทำให้เห็นทั้งความสัมพันธ์ระหว่างฟีเจอร์และการกระจายของแต่ละตัวในภาพชุดเดียว

import seaborn as sns
import matplotlib.pyplot as plt

iris = sns.load_dataset("iris")

g = sns.pairplot(
    iris,
    vars=["sepal_length", "sepal_width", "petal_length", "petal_width"],
    hue="species",
    plot_kws={"alpha": 0.8, "s": 50},
    diag_kind="hist",
    corner=True,
)
g.fig.suptitle("Scatter matrix ของชุดข้อมูล Iris", y=1.02)

plt.show()

Scatter matrix ของชุดข้อมูล Iris

วิธีอ่าน #

  • แนวทแยงคือการกระจายของแต่ละฟีเจอร์ ส่วนช่องอื่นๆ แสดงความสัมพันธ์เป็นคู่ๆ
  • สีช่วยให้เห็นแต่ละสายพันธุ์ว่ามีรูปแบบต่างกันอย่างไร เช่น กลุ่มที่แยกออกชัดเจน
  • ตัวเลือก corner=True แสดงเฉพาะครึ่งหนึ่งของเมทริกซ์ ลดความซ้ำซ้อนและทำให้กราฟอ่านง่ายขึ้น