Boxplot για περίληψη κατανομής

6.2.5

Boxplot για περίληψη κατανομής

Ενημέρωση 2020-03-25 Ανάγνωση 1 λεπτά

Το boxplot συνοψίζει τη διάμεσο, τα τεταρτημόρια και τα outliers σε μία απεικόνιση. Όταν συγκρίνουμε κατηγορίες, οι διαφορές στη διασπορά γίνονται άμεσα ορατές.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import seaborn as sns
import matplotlib.pyplot as plt

mpg = sns.load_dataset("mpg").dropna(subset=["mpg", "origin"])

fig, ax = plt.subplots(figsize=(6, 4))
sns.boxplot(data=mpg, x="origin", y="mpg", palette="Set2", ax=ax)

ax.set_xlabel("Περιοχή παραγωγής")
ax.set_ylabel("Κατανάλωση (MPG)")
ax.set_title("Boxplot κατανάλωσης ανά περιοχή")
ax.grid(axis="y", alpha=0.3)

fig.tight_layout()

plt.show()

Boxplot κατανάλωσης ανά περιοχή

Οδηγίες ανάγνωσης #

  • Το κουτί καλύπτει το IQR (Q1–Q3), η μεσαία γραμμή είναι η διάμεσος και τα whiskers τυπικά επεκτείνονται έως 1.5×IQR.
  • Αν τα outliers είναι υπερβολικά πολλά, δείτε τα σε ξεχωριστό γράφημα ή αλλάξτε τα όρια του άξονα.
  • Η οριζόντια διάταξη βοηθά όταν οι ετικέτες κατηγορίας είναι μεγάλες.