Verifique a normalidade com um grafico Q-Q

6.2.8

Verifique a normalidade com um grafico Q-Q

Atualizado 2020-05-06 Leitura 1 min

Com scipy.stats.probplot voce pode ver o quao perto seus dados estao de uma distribuicao normal. Pontos que se afastam muito da linha de referencia indicam maiores desvios de normalidade.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

data = np.random.normal(loc=0, scale=1, size=500)

fig, ax = plt.subplots(figsize=(5, 5))
stats.probplot(data, dist="norm", plot=ax)

ax.set_title("Grafico Q-Q (comparacao com a distribuicao normal)")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Quanto mais longe os pontos estiverem da linha, maior o desvio dos dados em relacao a normalidade.

Dicas de leitura #

  • Se os pontos estiverem na linha de 45°, os dados estao proximos da normalidade. Caudas curvas sugerem caudas pesadas ou leves.
  • Para testar outra distribuicao teorica, altere o argumento dist.
  • Informar a media e a variancia amostral junto ao grafico ajuda na interpretacao da distribuicao.