Scatter matrix για πολλαπλά ζεύγη

6.6.2

Scatter matrix για πολλαπλά ζεύγη

Ενημέρωση 2020-02-12 Ανάγνωση 1 λεπτά

Με το seaborn.pairplot δημιουργούμε διαγράμματα διασποράς για κάθε ζεύγος χαρακτηριστικών, ενώ στη διαγώνιο εμφανίζονται τα ιστογράμματα. Έτσι βλέπουμε σε ένα πλέγμα τόσο την κατανομή όσο και τη συσχέτιση.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import seaborn as sns
import matplotlib.pyplot as plt

iris = sns.load_dataset("iris")

g = sns.pairplot(
    iris,
    vars=["sepal_length", "sepal_width", "petal_length", "petal_width"],
    hue="species",
    plot_kws={"alpha": 0.8, "s": 50},
    diag_kind="hist",
    corner=True,
)
g.fig.suptitle("Scatter matrix του dataset Iris", y=1.02)

plt.show()

Scatter matrix του dataset Iris

Συμβουλές ανάγνωσης #

  • Η διαγώνιος δείχνει την κατανομή κάθε μεταβλητής, ενώ τα εκτός διαγωνίου πάνελ αποκαλύπτουν τη σχέση των ζευγών.
  • Το hue αναδεικνύει τα clusters (π.χ. είδη λουλουδιών) και επιτρέπει να δούμε ποια ζεύγη διαχωρίζουν καλύτερα τις ομάδες.
  • Με corner=True εμφανίζεται μόνο το κάτω τρίγωνο ώστε να αποφεύγεται ο διπλασιασμός των πλοκών και να διαβάζεται πιο καθαρά.