En estadística, el muestreo aleatorio de datos de una población a menudo conduce a la producción de una curva en forma de campana con la media centrada en el pico de la campana. Esto se conoce como una distribución normal. El teorema del límite central establece que a medida que aumenta el número de muestras, la media medida tiende a distribuirse normalmente alrededor de la media de la población y la desviación estándar se vuelve más estrecha. El teorema del límite central se puede usar para estimar la probabilidad de encontrar un valor particular dentro de una población.
Recolecte muestras y luego determine la media. Por ejemplo, suponga que desea calcular la probabilidad de que un hombre en los Estados Unidos tenga un nivel de colesterol de 230 miligramos por decilitro o más. Comenzaríamos recolectando muestras de 25 individuos y midiendo sus niveles de colesterol. Después de recopilar los datos, calcule la media de la muestra. La media se obtiene sumando cada valor medido y dividiéndolo por el número total de muestras. En este ejemplo, suponga que la media es de 211 miligramos por decilitro.
Calcule la desviación estándar, que es una medida de la "dispersión" de datos. Esto se puede hacer en unos sencillos pasos:
En este ejemplo, suponga que la desviación estándar es de 46 miligramos por decilitro.
Calcule el error estándar dividiendo la desviación estándar por la raíz cuadrada del número total de la muestra:
Error estándar = 46 / sqrt25 = 9.2
Dibuje un bosquejo de la distribución normal y sombree con la probabilidad apropiada. Siguiendo el ejemplo, desea saber la probabilidad de que un hombre tenga un nivel de colesterol de 230 miligramos por decilitro o más. Para encontrar la probabilidad, descubra cuántos errores estándar se alejan de la media de 230 miligramos por decilitro (valor Z):
Z = 230 - 211 / 9.2 = 2.07
Busque la probabilidad de obtener un valor de 2.07 errores estándar por encima de la media. Si necesita encontrar la probabilidad de encontrar un valor dentro de 2.07 desviaciones estándar de la media, entonces z es positivo. Si necesita encontrar la probabilidad de encontrar un valor más allá de 2.07 desviaciones estándar de la media, entonces z es negativo.
Busque el valor z en una tabla de probabilidad normal estándar. La primera columna en el lado izquierdo muestra el número entero y el primer lugar decimal del valor z. La fila a lo largo de la parte superior muestra el tercer decimal del valor z. Siguiendo el ejemplo, dado que nuestro valor z es -2.07, primero ubique -2.0 en la columna de la izquierda, luego escanee la fila superior para la entrada 0.07. El punto en el que se cruzan estas columnas y filas es la probabilidad. En este caso, el valor leído en la tabla es 0.0192 y, por lo tanto, la probabilidad de encontrar un hombre que tenga un nivel de colesterol de 230 miligramos por decilitro o superior es 1.92 por ciento.