Cómo encontrar una desviación estándar de muestra

Posted on
Autor: Randy Alexander
Fecha De Creación: 23 Abril 2021
Fecha De Actualización: 20 Noviembre 2024
Anonim
Cómo encontrar una desviación estándar de muestra - Ciencias
Cómo encontrar una desviación estándar de muestra - Ciencias

Contenido

Pruebas estadísticas como el t-test intrínsecamente depende del concepto de una desviación estándar. Cualquier estudiante de estadística o ciencias usará desviaciones estándar regularmente y necesitará comprender lo que significa y cómo encontrarlo a partir de un conjunto de datos. Afortunadamente, lo único que necesita son los datos originales, y aunque los cálculos pueden ser tediosos cuando tiene muchos datos, en estos casos debe usar funciones o datos de hojas de cálculo para hacerlo automáticamente. Sin embargo, todo lo que necesita hacer para comprender el concepto clave es ver un ejemplo básico que pueda resolver fácilmente a mano. En esencia, la desviación estándar de la muestra mide cuánto varía la cantidad que ha elegido en toda la población en función de su muestra.


TL; DR (demasiado largo; no leído)

Utilizando norte para significar el tamaño de la muestra, μ para la media de los datos, Xyo para cada punto de datos individual (de yo = 1 a yo = norte) y Σ como signo de suma, la varianza muestral (s2) es:

s2 = (Σ Xyoμ)2 / (norte − 1)

Y la desviación estándar de la muestra es:

s = √s2

Desviación estándar vs. Desviación estándar de muestra

Las estadísticas giran en torno a hacer estimaciones para poblaciones enteras basadas en muestras más pequeñas de la población, y tener en cuenta cualquier incertidumbre en la estimación en el proceso. Las desviaciones estándar cuantifican la cantidad de variación en la población que está estudiando. Si está tratando de encontrar la altura promedio, obtendrá un grupo de resultados alrededor del valor medio (el promedio), y la desviación estándar describe el ancho del grupo y la distribución de las alturas entre la población.


La desviación estándar de la "muestra" estima la verdadera desviación estándar para toda la población basándose en una pequeña muestra de la población. La mayoría de las veces, no podrá muestrear a toda la población en cuestión, por lo que la desviación estándar de la muestra suele ser la versión correcta.

Encontrar la desviación estándar de muestra

Necesita sus resultados y el número (norte) de personas en su muestra. Primero, calcule la media de los resultados (μ) sumando todos los resultados individuales y luego dividiéndolos por el número de mediciones.

Como ejemplo, las frecuencias cardíacas (en latidos por minuto) de cinco hombres y cinco mujeres son:

71, 83, 63, 70, 75, 69, 62, 75, 66, 68

Lo que lleva a una media de:

μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10


= 702 ÷ 10 = 70.2

La siguiente etapa es restar la media de cada medición individual y luego cuadrar el resultado. Como ejemplo, para el primer punto de datos:

(71 – 70.2)2 = 0.82 = 0.64

Y para el segundo:

(83 – 70.2)2 = 12.82 = 163.84

Continúa de esta manera a través de los datos y luego agrega estos resultados. Entonces, para los datos de ejemplo, la suma de estos valores es:

0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6

La siguiente etapa distingue entre la desviación estándar de la muestra y la desviación estándar de la población. Para la desviación de la muestra, divide este resultado por el tamaño de la muestra menos uno (norte −1). En nuestro ejemplo, norte = 10, entonces norte – 1 = 9.

Este resultado da la varianza muestral, denotada por s2, que para el ejemplo es:

s2 = 353.6 ÷ 9 = 39.289

La desviación estándar de muestra (s) es solo la raíz cuadrada positiva de este número:

s = √39.289 = 6.268

Si estuviera calculando la desviación estándar de la población (σ) la única diferencia es que divides por norte más bien que norte −1.

La fórmula completa para la desviación estándar de la muestra se puede expresar usando el símbolo de suma Σ, con la suma sobre la muestra completa, y Xyo representando el i_ésimo resultado de _n. La varianza muestral es:

s2 = (Σ Xyoμ)2 / (norte − 1)

Y la desviación estándar de la muestra es simplemente:

s = √s2

Desviación media versus desviación estándar

La desviación media difiere ligeramente de la desviación estándar. En lugar de cuadrar las diferencias entre la media y cada valor, simplemente toma la diferencia absoluta (ignorando cualquier signo menos) y luego encuentra el promedio de esos. Para el ejemplo de la sección anterior, los puntos de datos primero y segundo (71 y 83) dan:

X1μ = 71 – 70.2 = 0.8

X2μ = 83 – 70.2 = 12.8

El tercer punto de datos da un resultado negativo

X3μ = 63 – 70.2 = −7.2

Pero simplemente eliminas el signo menos y lo tomas como 7.2.

La suma de todos estos da dividida por norte da la desviación media. En el ejemplo:

(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64

Esto difiere sustancialmente de la desviación estándar calculada anteriormente, porque no involucra cuadrados y raíces.