Βασικό διάγραμμα διασποράς

6.5.1

Βασικό διάγραμμα διασποράς

Ενημέρωση 2020-01-29 Ανάγνωση 1 λεπτά

Το παράδειγμα αυτό δείχνει τη σχέση ανάμεσα σε ύψος και βάρος με τυχαία δεδομένα. Με το seaborn.scatterplot κρατάμε εύκολα ενιαίο στυλ για το γράφημα.

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

rng = np.random.default_rng(42)
height = rng.normal(167, 8, size=120)
weight = 0.6 * height + rng.normal(0, 5, size=120) + 30

fig, ax = plt.subplots(figsize=(5.5, 4))
sns.scatterplot(x=height, y=weight, ax=ax, color="#2563eb", edgecolor="white")

ax.set_xlabel("Ύψος (cm)")
ax.set_ylabel("Βάρος (kg)")
ax.set_title("Συσχέτιση ύψους και βάρους")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Βασικό διάγραμμα διασποράς για ύψος και βάρος

Πώς να το διαβάζετε #

  • Όσο ισχυρότερη η συσχέτιση τόσο περισσότερο τα σημεία σχηματίζουν μια στενή λωρίδα· όταν είναι αδύναμη, διασπείρονται κυκλικά.
  • Αν τα σημεία επικαλύπτονται, μειώστε το alpha ή δοκιμάστε άλλα γραφήματα όπως το hexbin.
  • Εντοπίζοντας outliers, σημειώστε και διερευνήστε τα ξεχωριστά για να βρείτε την αιτία.