สแคตเตอร์พล็อตพื้นฐานนี้ใช้ข้อมูลส่วนสูงและน้ำหนักที่สุ่มขึ้นมา เพื่อให้เห็นภาพความสัมพันธ์ของสองตัวแปรแบบง่ายๆ เมื่อใช้ seaborn.scatterplot เราจะได้สไตล์ที่สม่ำเสมอโดยไม่ต้องตั้งค่ามาก
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
rng = np.random.default_rng(42)
height = rng.normal(167, 8, size=120)
weight = 0.6 * height + rng.normal(0, 5, size=120) + 30
fig, ax = plt.subplots(figsize=(5.5, 4))
sns.scatterplot(x=height, y=weight, ax=ax, color="#2563eb", edgecolor="white")
ax.set_xlabel("ส่วนสูง (ซม.)")
ax.set_ylabel("น้ำหนัก (กก.)")
ax.set_title("ความสัมพันธ์ของส่วนสูงและน้ำหนัก")
ax.grid(alpha=0.2)
fig.tight_layout()
plt.show()

วิธีอ่าน #
- ถ้ามีความสัมพันธ์สูง จุดจะเรียงตัวเป็นแถบแคบๆ แต่ถ้าความสัมพันธ์ต่ำ จุดจะกระจายเป็นวงกลม
- หากจุดทับกันแน่นเกินไป ให้ลดค่า
alphaหรือพิจารณาวิธีอื่นอย่าง hexbin - เมื่อพบค่าผิดปกติ ให้ทำเครื่องหมายและสืบหาสาเหตุเพิ่มเติม