Scatter matrix για πολλαπλά ζεύγη

Visualize

Scatter matrix για πολλαπλά ζεύγη

Created: Last updated: Read time: 1 min

Με το seaborn.pairplot δημιουργούμε διαγράμματα διασποράς για κάθε ζεύγος χαρακτηριστικών, ενώ στη διαγώνιο εμφανίζονται τα ιστογράμματα. Έτσι βλέπουμε σε ένα πλέγμα τόσο την κατανομή όσο και τη συσχέτιση.

import seaborn as sns
import matplotlib.pyplot as plt

iris = sns.load_dataset("iris")

g = sns.pairplot(
    iris,
    vars=["sepal_length", "sepal_width", "petal_length", "petal_width"],
    hue="species",
    plot_kws={"alpha": 0.8, "s": 50},
    diag_kind="hist",
    corner=True,
)
g.fig.suptitle("Scatter matrix του dataset Iris", y=1.02)

plt.show()

Scatter matrix του dataset Iris

Συμβουλές ανάγνωσης #

  • Η διαγώνιος δείχνει την κατανομή κάθε μεταβλητής, ενώ τα εκτός διαγωνίου πάνελ αποκαλύπτουν τη σχέση των ζευγών.
  • Το hue αναδεικνύει τα clusters (π.χ. είδη λουλουδιών) και επιτρέπει να δούμε ποια ζεύγη διαχωρίζουν καλύτερα τις ομάδες.
  • Με corner=True εμφανίζεται μόνο το κάτω τρίγωνο ώστε να αποφεύγεται ο διπλασιασμός των πλοκών και να διαβάζεται πιο καθαρά.