Comprueba la normalidad con un grafico Q-Q

Visualize

Comprueba la normalidad con un grafico Q-Q

Creado: Última actualización: Tiempo de lectura: 1 min

Con scipy.stats.probplot puedes revisar que tan cerca estan tus datos de una distribucion normal. Los puntos que se alejan mucho de la linea de referencia indican mayores desviaciones de la normalidad.

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

data = np.random.normal(loc=0, scale=1, size=500)

fig, ax = plt.subplots(figsize=(5, 5))
stats.probplot(data, dist="norm", plot=ax)

ax.set_title("Grafico Q-Q (comparacion con la distribucion normal)")
ax.grid(alpha=0.2)

fig.tight_layout()

plt.show()

Cuanto mas lejos esten los puntos de la linea, mas se apartan los datos de la normalidad.

Consejos de lectura #

  • Si los puntos se alinean con la linea de 45°, los datos se aproximan a la normalidad. Colas curvadas sugieren colas pesadas o ligeras.
  • Para probar otra distribucion teorica, cambia el argumento dist.
  • Informar la media y la varianza muestral junto al grafico ayuda a interpretar la distribucion.