seaborn.pairplot วาดสแคตเตอร์ของทุกคู่ตัวแปรพร้อมกับฮิสโตแกรมบนแนวทแยง ทำให้เห็นทั้งความสัมพันธ์ระหว่างฟีเจอร์และการกระจายของแต่ละตัวในภาพชุดเดียว
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
g = sns.pairplot(
iris,
vars=["sepal_length", "sepal_width", "petal_length", "petal_width"],
hue="species",
plot_kws={"alpha": 0.8, "s": 50},
diag_kind="hist",
corner=True,
)
g.fig.suptitle("Scatter matrix ของชุดข้อมูล Iris", y=1.02)
plt.show()

วิธีอ่าน #
- แนวทแยงคือการกระจายของแต่ละฟีเจอร์ ส่วนช่องอื่นๆ แสดงความสัมพันธ์เป็นคู่ๆ
- สีช่วยให้เห็นแต่ละสายพันธุ์ว่ามีรูปแบบต่างกันอย่างไร เช่น กลุ่มที่แยกออกชัดเจน
- ตัวเลือก
corner=Trueแสดงเฉพาะครึ่งหนึ่งของเมทริกซ์ ลดความซ้ำซ้อนและทำให้กราฟอ่านง่ายขึ้น