Contenido
- TL; DR (demasiado largo; no leído)
- Puntos de datos de pedido
- Determinar la posición del primer cuartil
- Determinar la posición del tercer cuartil
- Calcular rango intercuartil
- Ventajas y desventajas de IQR
El rango intercuartil, a menudo abreviado como IQR, representa el rango desde el percentil 25 al percentil 75, o el 50 por ciento medio, de cualquier conjunto de datos dado. El rango intercuartil se puede usar para determinar cuál sería el rango promedio de rendimiento en una prueba: puede usarlo para ver dónde caen los puntajes de la mayoría de las personas en una prueba determinada, o determinar cuánto dinero gana el empleado promedio en una empresa cada mes . El rango intercuartil puede ser una herramienta más efectiva de análisis de datos que la media o la mediana de un conjunto de datos, ya que le permite identificar el rango de dispersión en lugar de un solo número.
TL; DR (demasiado largo; no leído)
El rango intercuartil (IQR) representa el 50 por ciento medio de un conjunto de datos. Para calcularlo, primero ordene sus puntos de datos de menor a mayor, luego determine sus posiciones del primer y tercer cuartil utilizando las fórmulas (N + 1) / 4 y 3 * (N + 1) / 4 respectivamente, donde N es el número de puntos en el conjunto de datos. Finalmente, reste el primer cuartil del tercer cuartil para determinar el rango intercuartil para el conjunto de datos.
Puntos de datos de pedido
El cálculo del rango intercuartil es una tarea simple, pero antes de calcular deberá organizar los distintos puntos de su conjunto de datos. Para hacer esto, comience ordenando sus puntos de datos de menor a mayor. Por ejemplo, si sus puntos de datos fueran 10, 19, 8, 4, 9, 12, 15, 11 y 20, los reorganizaría así: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Una vez que sus puntos de datos se han ordenado de esta manera, puede pasar al siguiente paso.
Determinar la posición del primer cuartil
Luego, determine la posición del primer cuartil usando la siguiente fórmula: (N + 1) / 4, donde N es el número de puntos en el conjunto de datos. Si el primer cuartil se encuentra entre dos números, tome el promedio de los dos números como su puntaje del primer cuartil. En el ejemplo anterior, dado que hay nueve puntos de datos, sumaría 1 a 9 para obtener 10, y luego dividir entre 4 para obtener 2.5. Dado que el primer cuartil cae entre el segundo y el tercer valor, tomaría el promedio de 8 y 9 para obtener una posición del primer cuartil de 8.5.
Determinar la posición del tercer cuartil
Una vez que haya determinado su primer cuartil, determine la posición del tercer cuartil usando la siguiente fórmula: 3 * (N + 1) / 4 donde N es nuevamente el número de puntos en el conjunto de datos. Del mismo modo, si el tercer cuartil se encuentra entre dos números, simplemente tome el promedio como lo haría al calcular la puntuación del primer cuartil. En el ejemplo anterior, dado que hay nueve puntos de datos, sumaría 1 a 9 para obtener 10, multiplique por 3 para obtener 30 y luego divida entre 4 para obtener 7.5. Como el primer cuartil cae entre el séptimo y el octavo valor, tomaría el promedio de 15 y 19 para obtener un puntaje del tercer cuartil de 17.
Calcular rango intercuartil
Una vez que haya determinado su primer y tercer cuartiles, calcule el rango intercuartil restando el valor del primer cuartil del valor del tercer cuartil. Para finalizar el ejemplo utilizado en el transcurso de este artículo, restarías 8.5 de 17 para encontrar que el rango intercuartil del conjunto de datos es igual a 8.5.
Ventajas y desventajas de IQR
El rango intercuartil tiene la ventaja de poder identificar y eliminar valores atípicos en ambos extremos de un conjunto de datos. IQR también es una buena medida de variación en casos de distribución de datos asimétrica, y este método de cálculo de IQR puede funcionar para conjuntos de datos agrupados, siempre que use una distribución de frecuencia acumulativa para organizar sus puntos de datos. La fórmula del rango intercuartil para datos agrupados es la misma que para los datos no agrupados, con IQR igual al valor del primer cuartil restado del valor del tercer cuartil. Sin embargo, tiene varias desventajas en comparación con la desviación estándar: menos sensibilidad a unos puntajes extremos y una estabilidad de muestreo que no es tan fuerte como la desviación estándar.