Home Blog/ Transformación digital/
Transformación digital

Medidas de dispersión: ¡basa tus decisiones en datos veraces y olvídate de las dudas existenciales!

Alexandra Carranza - 26 May 22

Articulo

7 min.

¬ŅTrabajas realizando an√°lisis estad√≠sticos? Posiblemente, hayas o√≠do sobre las medidas de dispersi√≥n. Este concepto que pertenece a la rama de la estad√≠stica descriptiva, hace referencia al grado en que las observaciones se dispersan o separan de la media. 

Aunque no lo creas, la estad√≠stica es muy √ļtil en diversos campos, pues permite comprender mejor la informaci√≥n que se est√° analizando y en base a ello, realizar estrategias en funci√≥n a los objetivos deseados. Por eso, entender bien para qu√© sirven las medidas de dispersi√≥n resulta clave para usarlas correctamente en diferentes situaciones.

Como destaca Jorge Karam, profesor del curso online de Analiza datos con Power BI, ‚Äúpara generar impacto, los datos deben traducirse en informaci√≥n clara y concreta, tu organizaci√≥n debe entender cada implicancia de la data que recoge para poder tomar decisiones acertadas‚ÄĚ.

Teniendo esto en consideraci√≥n, hemos elaborado esta nota que te permitir√° conocer mejor uno de los conceptos m√°s relevantes de la estad√≠stica: las medidas de dispersi√≥n. Te explicaremos a profundidad qu√© son las medidas de dispersi√≥n y para qu√© sirven. Adem√°s, te contaremos cu√°les son las principales medidas de dispersi√≥n y el uso de cada una de ellas.

Definición de las medidas de dispersión

Las medidas de dispersi√≥n consisten en n√ļmeros que otorgan informaci√≥n acerca de la variabilidad de los datos. Es decir, se encargan de mostrar qu√© tan juntos o separados se encuentran los datos de una distribuci√≥n. Por lo general, se usa junto con las medidas de tendencia central, como la media o la mediana, para proporcionar una descripci√≥n general de un conjunto de datos.

Como resalta Matemovil, ‚Äúlos valores de las medidas de dispersi√≥n nos permiten saber si los datos se encuentran estrechamente agrupados, si se encuentran ampliamente dispersos o si son iguales‚ÄĚ.

Cuando la medida de dispersi√≥n posee un valor peque√Īo, esto quiere decir que los datos est√°n ubicados cerca a la posici√≥n central, mientras que cuando tienen un valor grande, quiere decir que est√°n m√°s separados o alejados al centro.

Entonces, considerando lo mencionado, podemos definir las medidas de dispersi√≥n como las medidas estad√≠sticas orientadas en dar a conocer qu√© tan lejanas o pr√≥ximas se encuentran las puntuaciones de una variable, respecto a la media o promedio aritm√©tico. 

Características de las medidas de dispersión

Ahora que ya tienes m√°s claro el concepto de las medidas de dispersi√≥n o variabilidad, te brindaremos algunas de sus caracter√≠sticas m√°s representativas para que no te pierdas de ning√ļn detalle:

  • Las medidas de dispersi√≥n indican qu√© tan diseminados se encuentran los datos de una distribuci√≥n.

  • Permite conocer qu√© tan cerca o lejos de la media se encuentran los datos.

  • Las medidas de variabilidad te dan la posibilidad de saber la homogeneidad o heterogeneidad de las distribuciones de los datos.

  • Su aplicaci√≥n es f√°cil y r√°pida.

  • Su valores de dispersi√≥n siempre son positivos o cero, en caso estos sean iguales.

  • El uso de las medidas de dispersi√≥n se puede aplicar en diversos √°mbitos, como el sector salud, industrial, econ√≥mico empresarial, etc. 

 

¬ŅPara qu√© sirven las medidas de dispersi√≥n?

Sabemos que el objetivo de medir la dispersi√≥n es determinar el grado de desviaci√≥n que existe en los datos y, por lo tanto, los l√≠mites dentro de los cuales los datos variar√°n en alguna variable, atributo o cualidad medible. En ese sentido, las medidas de dispersi√≥n son de gran importancia y ocupan una posici√≥n √ļnica en los m√©todos estad√≠sticos.

Para que puedas comprender cuál es la utilidad de las medidas de dispersión, veamos sus principales aplicaciones:

1. Ayudan a entender el conjunto de datos

El uso más importante de las medidas de dispersión es que ayudan a comprender la distribución de los datos. A medida que los datos se vuelven más diversos, el valor de la medida de dispersión aumenta.

Por eso, el conocimiento de la dispersión es vital en la comprensión de la estadística. Básicamente, te ayuda a comprender conceptos como la diversificación de los datos, cómo se distribuyen y cómo se mantienen sobre el valor central o la tendencia central.

Además, las medidas de dispersión en la estadística te brinda una forma de obtener mejores conocimientos sobre la distribución de datos. Por ejemplo, 3 muestras distintas pueden tener la misma media, mediana o rango, pero niveles de variabilidad completamente diferentes.

2. Complementan la información dada por las medidas de tendencia central

Las medidas de dispersi√≥n tambi√©n se denominan promedios de segundo orden, es decir, promediar por segunda vez las desviaciones de una medida de tendencia central. 

Proporciona una estimación de los fenómenos a los que se refieren los datos dados (originales). Esto aumenta la precisión del análisis y la interpretación estadísticos, por lo que podrás estar en posición de sacar inferencias más confiables.

3. Hacen posible la comparación entre diferentes grupos

Si los datos originales se expresan en unidades diferentes, no será posible realizar comparaciones. Pero con la ayuda de medidas de dispersión relativas, todas estas comparaciones se pueden hacer fácilmente. La comparación precisa entre la variabilidad de dos series conducirá a resultados confiables.

4. Sirven como un control √ļtil para evitar conclusiones err√≥neas en la comparaci√≥n de datos

La media aritmética puede ser la misma de dos grupos diferentes, pero no revelará la prosperidad de un grupo y el atraso de otro. Este tipo de composición interna puede conocerse mediante la aplicación de las medidas de dispersión.

Por lo tanto, con la ayuda de las medidas de dispersión o variabilidad, no concluirás que ambos grupos son similares. Puedes encontrar que un grupo es próspero y el otro está atrasado al conocer la cantidad de variabilidad alrededor de las medidas de tendencia central.

Las medidas de dispersión son de gran valor en un análisis estadístico siempre que se pongan en práctica los coeficientes de dispersión. De lo contrario, las conclusiones extraídas no serán fiables en gran medida.

5. Controlan la variabilidad

Diferentes medidas de dispersi√≥n te brindan datos de variabilidad desde diferentes √°ngulos, y este conocimiento puede resultar √ļtil para controlar la variaci√≥n. Sobre todo, en el an√°lisis financiero de los negocios y la medicina, estas medidas de dispersi√≥n pueden resultar muy √ļtiles.

Además, proporcionan la base para análisis estadísticos posteriores, como el cálculo de la correlación, la regresión, la prueba de hipótesis, etc.

importancia de las medidas de dispersiónFuente: Unsplash

Tipos de medidas de dispersión

Las medidas de dispersi√≥n se pueden clasificar en dos amplias categor√≠as. Estas son medidas de dispersi√≥n absoluta y medidas de dispersi√≥n relativa. Dicho esto, veamos a profundidad cada una de ellas. ¬°Toma nota!

Medidas de dispersión absoluta

Las medidas de dispersi√≥n absoluta se encargan de presentar qu√© tan separados o juntos est√°n los datos, as√≠ como mostrar la variabilidad en funci√≥n al promedio de las desviaciones de observaci√≥n. Todo ello apoy√°ndose en medidas que mencionaremos, a continuaci√≥n:

1. Rango

El rango o recorrido es una medida de dispersión que hace referencia a la diferencia entre los valores extremos de un conjunto. Es decir, la resta entre su valor máximo y el mínimo.

  • R: Xmax - Xmin

Donde:

  • Rango: R

  • Valor M√°ximo de la muestra: Xmax

  • Valor M√≠nimo de la muestra: Xmin

Caracter√≠sticas 

  • El recorrido permite conocer la distancia entre el m√°ximo y el m√≠nimo valor.

  • Es la medida de dispersi√≥n m√°s simple.

  • Es m√°s sencillo de entender y calcular.

  • El uso del rango se limita a la concepci√≥n de ideas iniciales.

  • Solo considera a los valores extremos, m√°s no a los que se ubican en el intermedio.

persona analizando datos en su tabletFuente: Unsplash

2. Desviación media

Esta medida de dispersión es la diferencia entre los valores de la variable estadística y la media aritmética. Es decir, la media de las desviaciones absolutas, la cual se expresa de la siguiente manera:

  • Dm = 1/n [| x1 ‚Äď A |+| x2‚Äď A |+| xn ‚Äď A |]

Características

  • La desviaci√≥n media utiliza todas las observaciones para el c√°lculo.

  • Es compleja y poco comprensible.

  • El c√°lculo demanda bastante tiempo.

índice de la desviación mediaImagen: Unsplash

3. Desviación estándar o típica

Otra de las medidas de dispersión es la desviación estándar o típica. Se trata de la raíz cuadrada de la media aritmética de los cuadrados de los valores de las desviaciones. En resumen, es la raíz cuadrada de la varianza y es representada de la siguiente manera:

  • S= +‚ąö [|x1 ‚Äď A |2 n1] / N 
  • S=+‚ąöS2 

Características

  • La desviaci√≥n t√≠pica presta mayor atenci√≥n a las desviaciones extremas respecto al resto de desviaciones.

  • Es dif√≠cil de comprender y calcular.

  • Resulta cero si las dem√°s observaciones permanecen iguales.

medidas de dispersión proyectadas en una hoja blanca junto a una reglaImagen: Unsplash

4. Varianza 

La √ļltima de las medidas de dispersi√≥n absoluta es la varianza. Esta representa la variabilidad de un conjunto de datos respecto a su media aritm√©tica. Se representa como el cuadrado de las desviaciones frente a la media de una distribuci√≥n estad√≠stica y es expresada a trav√©s de la siguiente sintaxis:

  • S2= ő£ |x1 ‚Äď A |2 n1 / N

Características

  • Se le puede a√Īadir un valor a cada puntuaci√≥n de la variable y la varianza permanecer√° constante.

  • La varianza no cuenta con valores negativos, solo positivos o cero.

 

Medidas de dispersión relativa

Las medidas de dispersión relativa se utilizan para comparar la distribución de diversas muestras. Es decir, te permiten saber qué tan separados o dispersos se encuentran las puntuaciones en la distribución estadística, independientemente de cómo se presenten. Para ello, se apoyan en las siguientes medidas de dispersión relativa:

1. Coeficiente de variación

Esta medida de dispersi√≥n relativa brinda informaci√≥n sobre la dispersi√≥n relativa de un conjunto de datos respecto a la media o promedio aritm√©tico y a su vez, la dispersi√≥n de los datos entre s√≠.

B√°sicamente, se utiliza para comparar el conjunto de datos con respecto a la homogeneidad o consistencia. Esta se expresa en forma de porcentaje de la siguiente manera:

  • CV = (ŌÉ / X) 100

  • X = desviaci√≥n est√°ndar

  • ŌÉ = media

Características

  • El coeficiente de variaci√≥n es calculado como cociente entre la desviaci√≥n est√°ndar y la media aritm√©tica.

  • Representa un n√ļmero abstracto.

  • Indica el grado de variabilidad de un conjunto de datos.

  • Revela la representatividad de la media.

an√°lisis de datos en tiempo realFuente: Unsplash

2. Coeficiente de rango

Es la medida de dispersión relativa que consiste en la relación entre la diferencia del valor más alto y valor el más bajo en un conjunto de datos, y la suma del valor más alto y valor más bajo.

En pocas palabras, se calcula como la raz√≥n de la diferencia entre los t√©rminos mayor y menor de la distribuci√≥n, a la suma de los t√©rminos mayor y menor de la distribuci√≥n. Esta es la f√≥rmula: 

  • L-S / L + S

  • donde L = valor m√°s grande

  • S = valor m√°s peque√Īo

coeficiente de rangoFuente: Pexels

3. Coeficiente de desviación media

Se puede definir como la relación entre la desviación media y el valor del punto central a partir del cual se calcula. Esta medida de dispersión relativa se representa de la siguiente manera:

  • Desviaci√≥n media utilizando la media: ‚ąĎ | X-M | / norte

  • Desviaci√≥n media utilizando la media: ‚ąĎ | X-X1 | / norte

coeficiente de desviación mediaFuente: Pexels

4. Coeficiente de desviación del cuartil

Es la razón de la diferencia entre el tercer cuartil y el primer cuartil a la suma del tercer y primer cuartil. La fórmula de esta medida de dispersión relativa se define así:

  • (T3 ‚Äď T3) / (T3 + T1)

  • Q3 = Cuartil superior

  • Q1 = Cuartil inferior

analista de datos revisando informaciónFuente: Unsplash

5. Coeficiente de desviación estándar

Otra de las medidas de dispersión relativa es el coeficiente de desviación estándar. Se trata de la relación de la desviación estándar con la media de la distribución de términos. Esta es su fórmula:

  • ŌÉ = ( ‚ąö( X ‚Äď X1)) / (N - 1)

  • Desviaci√≥n = (X ‚Äď X1)

  • ŌÉ = desviaci√≥n est√°ndar

  • N= n√ļmero total

En definitiva, las medidas de dispersi√≥n absolutas y relativas son muy √ļtiles al calcular diferentes aspectos de los datos. De hecho, cuando las usas con la ciencia de datos, lograr esto se vuelve m√°s f√°cil, de modo que puedas incorporar la automatizaci√≥n de procesos en tu empresa f√°cilmente.

Coeficiente de desviación estándarFuente: Unsplash

Ejemplo de medida de dispersión

Estamos seguros que ya tendr√°s una idea de c√≥mo puede presentarse estas medidas de dispersi√≥n en las situaciones cotidianas o los negocios. Sin embargo, para que no quede ninguna duda relacionada a esta medida estad√≠stica, te brindaremos un ejemplo en el cu√°l se hace evidente su importancia. 

Imag√≠nate que te vas de viaje con tus amigos y el hotel d√≥nde se est√°n alojando cuenta con una piscina que tiene una media de 1.60 metros. Considerando que tu altura es de 1.70 metros, podr√≠as pensar entrar a la piscina sin ning√ļn inconveniente. 

Sin embargo, como no sabes nadar, prefieres ser precavido y conocer si toda la piscina cuenta con la misma profundidad. Para ello, te diriges donde el salvavidas y le consultas cu√°l es la altura m√°xima y m√≠nima, ya que, en base a eso, podr√°s decidir si puedes utilizar toda la piscina o solo moverte hasta un determinado punto. 

Resulta que la altura m√°xima de la piscina es de 1.80 metros; mientras que la m√≠nima es de 1.40 metros. Esto quiere decir que si te mueves hasta el punto m√°s profundo, puede ser que corras peligro, pues seg√ļn el ejemplo de medida de dispersi√≥n, no sabes nadar, por lo que lo m√°s recomendable ser√≠a ingresar con alg√ļn flotador o solo moverte hasta la mitad de la piscina. 

computadora port√°til con an√°lisis de datosFuente: Pexels

¬ŅYa te sientes listo para iniciarte en el an√°lisis de datos? Ahora que conoces m√°s sobre las medidas de dispersi√≥n y su clasificaci√≥n, estamos seguros que se te har√° m√°s pr√°ctico poder comprender y participar de cursos o trabajos que requieran del empleo de esta medida estad√≠stica.

¬ŅQuieres aprender m√°s del mundo de la estad√≠stica y emplear las medidas de dispersi√≥n adecuadamente? Entonces, dale un vistazo a nuestro cat√°logo de cursos online de inteligencia y ciencia de datos, en el que encontrar√°s las herramientas necesarias para dominar Excel, realizar tablas din√°micas, etc. 

¬°Te esperamos en la siguiente nota!