Periksa normalitas dengan plot Q-Q

6.2.8

Periksa normalitas dengan plot Q-Q

Diperbarui 2020-05-06 Baca 1 menit

Dengan scipy.stats.probplot, kamu bisa melihat seberapa dekat data mengikuti distribusi normal. Titik yang jauh dari garis acuan menandakan penyimpangan yang lebih besar dari normalitas.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

data = np.random.normal(loc=0, scale=1, size=500)

fig, ax = plt.subplots(figsize=(5, 5))
stats.probplot(data, dist="norm", plot=ax)

ax.set_title("Plot Q-Q (perbandingan dengan distribusi normal)")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Semakin jauh titik dari garis, semakin besar penyimpangan data dari normalitas.

Kiat membaca #

  • Jika titik berada di garis 45°, data mendekati normal. Ekor yang melengkung menandakan ekor berat atau ringan.
  • Untuk menguji distribusi teoretis lain, ubah argumen dist.
  • Melaporkan rata-rata dan varians sampel bersama plot membantu interpretasi distribusi.