Με το seaborn.pairplot δημιουργούμε διαγράμματα διασποράς για κάθε ζεύγος χαρακτηριστικών, ενώ στη διαγώνιο εμφανίζονται τα ιστογράμματα. Έτσι βλέπουμε σε ένα πλέγμα τόσο την κατανομή όσο και τη συσχέτιση.
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
g = sns.pairplot(
iris,
vars=["sepal_length", "sepal_width", "petal_length", "petal_width"],
hue="species",
plot_kws={"alpha": 0.8, "s": 50},
diag_kind="hist",
corner=True,
)
g.fig.suptitle("Scatter matrix του dataset Iris", y=1.02)
plt.show()

Συμβουλές ανάγνωσης #
- Η διαγώνιος δείχνει την κατανομή κάθε μεταβλητής, ενώ τα εκτός διαγωνίου πάνελ αποκαλύπτουν τη σχέση των ζευγών.
- Το
hueαναδεικνύει τα clusters (π.χ. είδη λουλουδιών) και επιτρέπει να δούμε ποια ζεύγη διαχωρίζουν καλύτερα τις ομάδες. - Με
corner=Trueεμφανίζεται μόνο το κάτω τρίγωνο ώστε να αποφεύγεται ο διπλασιασμός των πλοκών και να διαβάζεται πιο καθαρά.