Contenido
Después de realizar una encuesta o recopilar datos numéricos sobre una población, los resultados deben analizarse para ayudarlo a sacar conclusiones. Desea conocer parámetros como la respuesta promedio, qué tan variadas fueron las respuestas y cómo se distribuyen las respuestas. Una distribución normal significa que, cuando se grafica, los datos crean una curva de campana que se centra en la respuesta promedio y se reduce igualmente en ambas direcciones, positiva y negativa. Si los datos no están centrados en el promedio y una cola es más larga que la otra, entonces la distribución de datos está sesgada. Puede calcular la cantidad de sesgo en los datos utilizando el promedio, la desviación estándar y el número de puntos de datos.
Calcular la inclinación de la población
Sume todos los valores del conjunto de datos y divídalos por el número de puntos de datos para obtener el promedio o la media. Para este ejemplo, asumiremos un conjunto de datos que incluye respuestas de una población completa: 2, 4, 5, 7, 8, 10, 11, 25, 26, 27, 36. Este conjunto tiene una media de 14,6.
Calcule la desviación estándar del conjunto de datos al cuadrar la diferencia entre cada punto de datos y la media, sumando todos esos resultados, luego dividiendo por el número de puntos de datos y finalmente sacando la raíz cuadrada. Nuestro conjunto de datos tiene una desviación estándar de 11.1.
Encuentre la diferencia entre cada punto de datos y la media, divida por la desviación estándar, cube ese número y luego sume todos esos números para cada punto de datos. Esto es igual a 6.79.
Calcule la asimetría de la población dividiendo 6.79 por el número total de puntos de datos. La asimetría de la población para este ejemplo es 0.617.
Calcular la inclinación de la muestra
Calcule la media y la desviación estándar de un conjunto de datos que es solo una muestra de toda la población. Usaremos el mismo conjunto de datos que el ejemplo anterior con media 14.6 y desviación estándar 11.1, suponiendo que estos números son solo una muestra de una población más grande.
Encuentre la diferencia entre cada punto de datos y la media, cube ese número, sume cada resultado y luego divida por el cubo de la desviación estándar. Esto es igual a 5.89.
Calcule el sesgo de la muestra multiplicando 5.89 por el número de puntos de datos, dividido por el número de puntos de datos menos 1, y dividido nuevamente por el número de puntos de datos menos 2. El sesgo de la muestra para este ejemplo sería 0.720.