Home Blog/ Transformación digital/
Transformación digital

¿Trabajas realizando análisis estadísticos? Posiblemente, hayas oído sobre las medidas de dispersión. Este concepto que pertenece a la rama de la estadística descriptiva, hace referencia al grado en que las observaciones se dispersan o separan de la media. 

Aunque no lo creas, la estadística es muy útil en diversos campos, pues permite comprender mejor la información que se está analizando y en base a ello, realizar estrategias en función a los objetivos deseados. Por eso, entender bien para qué sirven las medidas de dispersión resulta clave para usarlas correctamente en diferentes situaciones.

Como destaca Jorge Karam, profesor del  curso online de Analiza datos con Power BI, “para generar impacto, los datos deben traducirse en información clara y concreta, tu organización debe entender cada implicancia de la data que recoge para poder tomar decisiones acertadas”.

Teniendo esto en consideración, hemos elaborado esta nota que te permitirá conocer mejor uno de los conceptos más relevantes de la estadística: las medidas de dispersión. Te explicaremos a profundidad qué son las medidas de dispersión y para qué sirven. Además, te contaremos cuáles son las principales medidas de dispersión y el uso de cada una de ellas.

Definición de las medidas de dispersión

Las medidas de dispersión consisten en números que otorgan información acerca de la variabilidad de los datos. Es decir, se encargan de mostrar qué tan juntos o separados se encuentran los datos de una distribución. Por lo general, se usa junto con las medidas de tendencia central, como la media o la mediana, para proporcionar una descripción general de un conjunto de datos.

Como resalta Matemovil, “los valores de las medidas de dispersión nos permiten saber si los datos se encuentran estrechamente agrupados, si se encuentran ampliamente dispersos o si son iguales”.

Cuando la medida de dispersión posee un valor pequeño, esto quiere decir que los datos están ubicados cerca a la posición central, mientras que cuando tienen un valor grande, quiere decir que están más separados o alejados al centro.

Entonces, considerando lo mencionado, podemos definir las medidas de dispersión como las medidas estadísticas orientadas en dar a conocer qué tan lejanas o próximas se encuentran las puntuaciones de una variable, respecto a la media o promedio aritmético. 

Características de las medidas de dispersión

Ahora que ya tienes más claro el concepto de las medidas de dispersión o variabilidad, te brindaremos algunas de sus características más representativas para que no te pierdas de ningún detalle:

  • Las medidas de dispersión indican qué tan diseminados se encuentran los datos de una distribución.

  • Permite conocer qué tan cerca o lejos de la media se encuentran los datos.

  • Las medidas de variabilidad te dan la posibilidad de saber la homogeneidad o heterogeneidad de las distribuciones de los datos.

  • Su aplicación es fácil y rápida.

  • Su valores de dispersión siempre son positivos o cero, en caso estos sean iguales.

  • El uso de las medidas de dispersión se puede aplicar en diversos ámbitos, como el sector salud, industrial, económico empresarial, etc. 

 

¿Para qué sirven las medidas de dispersión?

Sabemos que el objetivo de medir la dispersión es determinar el grado de desviación que existe en los datos y, por lo tanto, los límites dentro de los cuales los datos variarán en alguna variable, atributo o cualidad medible. En ese sentido, las medidas de dispersión son de gran importancia y ocupan una posición única en los métodos estadísticos.

Para que puedas comprender cuál es la utilidad de las medidas de dispersión, veamos sus principales aplicaciones:

1. Ayudan a entender el conjunto de datos

El uso más importante de las medidas de dispersión es que ayudan a comprender la distribución de los datos. A medida que los datos se vuelven más diversos, el valor de la medida de dispersión aumenta.

Por eso, el conocimiento de la dispersión es vital en la comprensión de la estadística. Básicamente, te ayuda a comprender conceptos como la diversificación de los datos, cómo se distribuyen y cómo se mantienen sobre el valor central o la tendencia central.

Además, las medidas de dispersión en la estadística te brinda una forma de obtener mejores conocimientos sobre la distribución de datos. Por ejemplo, 3 muestras distintas pueden tener la misma media, mediana o rango, pero niveles de variabilidad completamente diferentes.

2. Complementan la información dada por las medidas de tendencia central

Las medidas de dispersión también se denominan promedios de segundo orden, es decir, promediar por segunda vez las desviaciones de una medida de tendencia central. 

Proporciona una estimación de los fenómenos a los que se refieren los datos dados (originales). Esto aumenta la precisión del análisis y la interpretación estadísticos, por lo que podrás estar en posición de sacar inferencias más confiables.

3. Hacen posible la comparación entre diferentes grupos

Si los datos originales se expresan en unidades diferentes, no será posible realizar comparaciones. Pero con la ayuda de medidas de dispersión relativas, todas estas comparaciones se pueden hacer fácilmente. La comparación precisa entre la variabilidad de dos series conducirá a resultados confiables.

4. Sirven como un control útil para evitar conclusiones erróneas en la comparación de datos

La media aritmética puede ser la misma de dos grupos diferentes, pero no revelará la prosperidad de un grupo y el atraso de otro. Este tipo de composición interna puede conocerse mediante la aplicación de las medidas de dispersión.

Por lo tanto, con la ayuda de las medidas de dispersión o variabilidad, no concluirás que ambos grupos son similares. Puedes encontrar que un grupo es próspero y el otro está atrasado al conocer la cantidad de variabilidad alrededor de las medidas de tendencia central.

Las medidas de dispersión son de gran valor en un análisis estadístico siempre que se pongan en práctica los coeficientes de dispersión. De lo contrario, las conclusiones extraídas no serán fiables en gran medida.

5. Controlan la variabilidad

Diferentes medidas de dispersión te brindan datos de variabilidad desde diferentes ángulos, y este conocimiento puede resultar útil para controlar la variación. Sobre todo, en el análisis financiero de los negocios y la medicina, estas medidas de dispersión pueden resultar muy útiles.

Además, proporcionan la base para análisis estadísticos posteriores, como el cálculo de la correlación, la regresión, la prueba de hipótesis, etc.

importancia de las medidas de dispersiónFuente: Unsplash

Tipos de medidas de dispersión

Las medidas de dispersión se pueden clasificar en dos amplias categorías. Estas son medidas de dispersión absoluta y medidas de dispersión relativa. Dicho esto, veamos a profundidad cada una de ellas. ¡Toma nota!

Medidas de dispersión absoluta

Las medidas de dispersión absoluta se encargan de presentar qué tan separados o juntos están los datos, así como mostrar la variabilidad en función al promedio de las desviaciones de observación. Todo ello apoyándose en medidas que mencionaremos, a continuación:

1. Rango

El rango o recorrido es una medida de dispersión que hace referencia a la diferencia entre los valores extremos de un conjunto. Es decir, la resta entre su valor máximo y el mínimo.

  • R: Xmax - Xmin

Donde:

  • Rango: R

  • Valor Máximo de la muestra: Xmax

  • Valor Mínimo de la muestra: Xmin

Características 

  • El recorrido permite conocer la distancia entre el máximo y el mínimo valor.

  • Es la medida de dispersión más simple.

  • Es más sencillo de entender y calcular.

  • El uso del rango se limita a la concepción de ideas iniciales.

  • Solo considera a los valores extremos, más no a los que se ubican en el intermedio.

persona analizando datos en su tabletFuente: Unsplash

2. Desviación media

Esta medida de dispersión es la diferencia entre los valores de la variable estadística y la media aritmética. Es decir, la media de las desviaciones absolutas, la cual se expresa de la siguiente manera:

  • Dm = 1/n [| x1 – A |+| x2– A |+| xn – A |]

Características

  • La desviación media utiliza todas las observaciones para el cálculo.

  • Es compleja y poco comprensible.

  • El cálculo demanda bastante tiempo.

índice de la desviación mediaImagen: Unsplash

3. Desviación estándar o típica

Otra de las medidas de dispersión es la desviación estándar o típica. Se trata de la raíz cuadrada de la media aritmética de los cuadrados de los valores de las desviaciones. En resumen, es la raíz cuadrada de la varianza y es representada de la siguiente manera:

  • S= +√ [|x1 – A |2 n1] / N 
  • S=+√S2 

Características

  • La desviación típica presta mayor atención a las desviaciones extremas respecto al resto de desviaciones.

  • Es difícil de comprender y calcular.

  • Resulta cero si las demás observaciones permanecen iguales.

medidas de dispersión proyectadas en una hoja blanca junto a una reglaImagen: Unsplash

4. Varianza 

La última de las medidas de dispersión absoluta es la varianza. Esta representa la variabilidad de un conjunto de datos respecto a su media aritmética. Se representa como el cuadrado de las desviaciones frente a la media de una distribución estadística y es expresada a través de la siguiente sintaxis:

  • S2= Σ |x1 – A |2 n1 / N

Características

  • Se le puede añadir un valor a cada puntuación de la variable y la varianza permanecerá constante.

  • La varianza no cuenta con valores negativos, solo positivos o cero.

 

Medidas de dispersión relativa

Las medidas de dispersión relativa se utilizan para comparar la distribución de diversas muestras. Es decir, te permiten saber qué tan separados o dispersos se encuentran las puntuaciones en la distribución estadística, independientemente de cómo se presenten. Para ello, se apoyan en las siguientes medidas de dispersión relativa:

1. Coeficiente de variación

Esta medida de dispersión relativa brinda información sobre la dispersión relativa de un conjunto de datos respecto a la media o promedio aritmético y a su vez, la dispersión de los datos entre sí.

Básicamente, se utiliza para comparar el conjunto de datos con respecto a la homogeneidad o consistencia. Esta se expresa en forma de porcentaje de la siguiente manera:

  • CV = (σ / X) 100

  • X = desviación estándar

  • σ = media

Características

  • El coeficiente de variación es calculado como cociente entre la desviación estándar y la media aritmética.

  • Representa un número abstracto.

  • Indica el grado de variabilidad de un conjunto de datos.

  • Revela la representatividad de la media.

análisis de datos en tiempo realFuente: Unsplash

2. Coeficiente de rango

Es la medida de dispersión relativa que consiste en la relación entre la diferencia del valor más alto y valor el más bajo en un conjunto de datos, y la suma del valor más alto y valor más bajo.

En pocas palabras, se calcula como la razón de la diferencia entre los términos mayor y menor de la distribución, a la suma de los términos mayor y menor de la distribución. Esta es la fórmula: 

  • L-S / L + S

  • donde L = valor más grande

  • S = valor más pequeño

coeficiente de rangoFuente: Pexels

3. Coeficiente de desviación media

Se puede definir como la relación entre la desviación media y el valor del punto central a partir del cual se calcula. Esta medida de dispersión relativa se representa de la siguiente manera:

  • Desviación media utilizando la media: ∑ | X-M | / norte

  • Desviación media utilizando la media: ∑ | X-X1 | / norte

coeficiente de desviación mediaFuente: Pexels

4. Coeficiente de desviación del cuartil

Es la razón de la diferencia entre el tercer cuartil y el primer cuartil a la suma del tercer y primer cuartil. La fórmula de esta medida de dispersión relativa se define así:

  • (T3 – T3) / (T3 + T1)

  • Q3 = Cuartil superior

  • Q1 = Cuartil inferior

analista de datos revisando informaciónFuente: Unsplash

5. Coeficiente de desviación estándar

Otra de las medidas de dispersión relativa es el coeficiente de desviación estándar. Se trata de la relación de la desviación estándar con la media de la distribución de términos. Esta es su fórmula:

  • σ = ( √( X – X1)) / (N - 1)

  • Desviación = (X – X1)

  • σ = desviación estándar

  • N= número total

En definitiva, las medidas de dispersión absolutas y relativas son muy útiles al calcular diferentes aspectos de los datos. De hecho, cuando las usas con la ciencia de datos, lograr esto se vuelve más fácil, de modo que puedas incorporar la automatización de procesos en tu empresa fácilmente.

Coeficiente de desviación estándarFuente: Unsplash

Ejemplo de medida de dispersión

Estamos seguros que ya tendrás una idea de cómo puede presentarse estas medidas de dispersión en las situaciones cotidianas o los negocios. Sin embargo, para que no quede ninguna duda relacionada a esta medida estadística, te brindaremos un ejemplo en el cuál se hace evidente su importancia. 

Imagínate que te vas de viaje con tus amigos y el hotel dónde se están alojando cuenta con una piscina que tiene una media de 1.60 metros. Considerando que tu altura es de 1.70 metros, podrías pensar entrar a la piscina sin ningún inconveniente. 

Sin embargo, como no sabes nadar, prefieres ser precavido y conocer si toda la piscina cuenta con la misma profundidad. Para ello, te diriges donde el salvavidas y le consultas cuál es la altura máxima y mínima, ya que, en base a eso, podrás decidir si puedes utilizar toda la piscina o solo moverte hasta un determinado punto. 

Resulta que la altura máxima de la piscina es de 1.80 metros; mientras que la mínima es de 1.40 metros. Esto quiere decir que si te mueves hasta el punto más profundo, puede ser que corras peligro, pues según el ejemplo de medida de dispersión, no sabes nadar, por lo que lo más recomendable sería ingresar con algún flotador o solo moverte hasta la mitad de la piscina. 

computadora portátil con análisis de datosFuente: Pexels

¿Ya te sientes listo para iniciarte en el análisis de datos? Ahora que conoces más sobre las medidas de dispersión y su clasificación, estamos seguros que se te hará más práctico poder comprender y participar de cursos o trabajos que requieran del empleo de esta medida estadística.

¿Quieres aprender más del mundo de la estadística y emplear las medidas de dispersión adecuadamente? Entonces, dale un vistazo a nuestro catálogo de cursos online de inteligencia y ciencia de datos, en el que encontrarás las herramientas necesarias para dominar Excel, realizar tablas dinámicas, etc. 

¡Te esperamos en la siguiente nota!