Το παράδειγμα αυτό δείχνει τη σχέση ανάμεσα σε ύψος και βάρος με τυχαία δεδομένα. Με το seaborn.scatterplot κρατάμε εύκολα ενιαίο στυλ για το γράφημα.
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
rng = np.random.default_rng(42)
height = rng.normal(167, 8, size=120)
weight = 0.6 * height + rng.normal(0, 5, size=120) + 30
fig, ax = plt.subplots(figsize=(5.5, 4))
sns.scatterplot(x=height, y=weight, ax=ax, color="#2563eb", edgecolor="white")
ax.set_xlabel("Ύψος (cm)")
ax.set_ylabel("Βάρος (kg)")
ax.set_title("Συσχέτιση ύψους και βάρους")
ax.grid(alpha=0.2)
fig.tight_layout()
plt.show()

Πώς να το διαβάζετε #
- Όσο ισχυρότερη η συσχέτιση τόσο περισσότερο τα σημεία σχηματίζουν μια στενή λωρίδα· όταν είναι αδύναμη, διασπείρονται κυκλικά.
- Αν τα σημεία επικαλύπτονται, μειώστε το
alphaή δοκιμάστε άλλα γραφήματα όπως το hexbin. - Εντοπίζοντας outliers, σημειώστε και διερευνήστε τα ξεχωριστά για να βρείτε την αιτία.