Με το scipy.stats.probplot συγκρίνουμε γραφικά τα δεδομένα με μια θεωρητική κατανομή (εδώ: κανονική). Όσο περισσότερο τα σημεία απομακρύνονται από την ευθεία, τόσο λιγότερο κανονική είναι η πραγματική κατανομή.
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
data = np.random.normal(loc=0, scale=1, size=500)
fig, ax = plt.subplots(figsize=(5, 5))
stats.probplot(data, dist="norm", plot=ax)
ax.set_title("Q-Q plot σε σχέση με την κανονική")
ax.grid(alpha=0.2)
fig.tight_layout()
plt.show()

Συμβουλές ανάγνωσης #
- Όταν τα σημεία ευθυγραμμίζονται με την 45 μοιρών ευθεία, η κατανομή μοιάζει με την θεωρητική· οι αποκλίσεις στα άκρα δείχνουν βαρύτερες ή ελαφρύτερες ουρές.
- Δοκιμάστε άλλες κατανομές αλλάζοντας το
dist(π.χ. t, exponential). - Παρουσιάστε μαζί και μέση τιμή/διακύμανση για να βοηθήσετε στην ερμηνεία.