Βασικό διάγραμμα διασποράς

6.5.1

Βασικό διάγραμμα διασποράς

Ενημέρωση 2020-01-29 Ανάγνωση 1 λεπτά

Το παράδειγμα αυτό δείχνει τη σχέση ανάμεσα σε ύψος και βάρος με τυχαία δεδομένα. Με το seaborn.scatterplot κρατάμε εύκολα ενιαίο στυλ για το γράφημα.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

rng = np.random.default_rng(42)
height = rng.normal(167, 8, size=120)
weight = 0.6 * height + rng.normal(0, 5, size=120) + 30

fig, ax = plt.subplots(figsize=(5.5, 4))
sns.scatterplot(x=height, y=weight, ax=ax, color="#2563eb", edgecolor="white")

ax.set_xlabel("Ύψος (cm)")
ax.set_ylabel("Βάρος (kg)")
ax.set_title("Συσχέτιση ύψους και βάρους")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Βασικό διάγραμμα διασποράς για ύψος και βάρος

Πώς να το διαβάζετε #

  • Όσο ισχυρότερη η συσχέτιση τόσο περισσότερο τα σημεία σχηματίζουν μια στενή λωρίδα· όταν είναι αδύναμη, διασπείρονται κυκλικά.
  • Αν τα σημεία επικαλύπτονται, μειώστε το alpha ή δοκιμάστε άλλα γραφήματα όπως το hexbin.
  • Εντοπίζοντας outliers, σημειώστε και διερευνήστε τα ξεχωριστά για να βρείτε την αιτία.