Dengan scipy.stats.probplot, kamu bisa melihat seberapa dekat data mengikuti distribusi normal. Titik yang jauh dari garis acuan menandakan penyimpangan yang lebih besar dari normalitas.
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
data = np.random.normal(loc=0, scale=1, size=500)
fig, ax = plt.subplots(figsize=(5, 5))
stats.probplot(data, dist="norm", plot=ax)
ax.set_title("Plot Q-Q (perbandingan dengan distribusi normal)")
ax.grid(alpha=0.2)
fig.tight_layout()
plt.show()

Kiat membaca #
- Jika titik berada di garis 45°, data mendekati normal. Ekor yang melengkung menandakan ekor berat atau ringan.
- Untuk menguji distribusi teoretis lain, ubah argumen
dist. - Melaporkan rata-rata dan varians sampel bersama plot membantu interpretasi distribusi.