miércoles, 5 de diciembre de 2012

Tema 4: Medidas de dispersión



MEDIDAS DE DISPERSIÓN

Evidencia 13 (17-Octubre)
El día de hoy en la clase de estadística aprendí a calcular las Medidas de Dispersión. Éstas, a diferencia de las Medidas de Tendencia Central, hacen referencia a "los valores numéricos que describen la forma en que las observaciones están dispersas o distribuidas con respecto al valor central". En otras palabras, las Medidas de Dispersión nos indican cuan "esparcidos" se encuentran los datos o valores en relación a la Media. Asimismo, aprendí las 4 diferentes Medidas de Dispersión. 


En primer lugar: el rango. Se define como la amplitud de la base de datos, y está determinado por los dos valores extremos de la muestra. El rango se determina restando el dato mayor menos el dato menor, por ejemplo: 

"Las edades de los niños con mayor rezago escolar de la escuela primaria Benito Juárez del turno vespertino son: 

7, 6, 8, 9, 6, 6, 7, 7, 8, 9, 6, 6, 6, 6, 7, 8, 6, 6, 6, 7, 9, 6, 6, 7, 7, 7, 6, 7, 6, 6, 6, 7, 8, 9, 6, 6, 6, 6, 8, 7, 6, 10, 7, 8, 7, 7, 7, 9."

Calcular el rango:

R= 10-6 = 4

Así, el rango es la Medida de Dispersión mas sencilla de calcular, no obstante, casi no se emplea debido a que sólo usa dos de los valores y los demás prácticamente los excluye. 


En segundo lugar, aprendí a determinar la varianza. Ésta es el "promedio al cuadrado de las desviaciones de cada dato con respecto a la media." La varianza se representa como s2 cuando se trata de una población, y como σ2 cuando estamos trabajando con una muestra.
El procedimiento para calcular la varianza es el siguiente: 


1) A cada valor se le resta el valor de la Media, y después se multiplica por sí mismo (es decir, se eleva al cuadrado).

2) Se hace la sumatoria de cada resultado que hayamos obtenido del paso anterior.

3) Ahora, se divide el resultado de la sumatoria entre el total de datos menos 1.

Para entender el procedimiento tenemos el siguiente ejemplo: 

"Se desea conocer el número de hijos que tienen los trabajadores de una empresa, para ello se encuestó a algunos de ellos, obteniendo los siguientes resultados:
3, 4, 2, 0, 2, 3, 0, 1, 1, 3, 2, 2, 2, 3, 2, 1, 2, 2, 4, 3, 3, 4, 1, 2, 2."

Calcular la varianza: 

x = 54/25 = 2.16

3-2.16= (0.84)(0.84)= 0.7056

4-2.16= (1.84)(1.84)= 3.3856

2-2.16= (-0.16)(-0.16)= 0.0256 

0-2.16= (-2.16)(-2.16)= 4.6656

2-2.16= (-0.16)(-0.16)= 0.0256 

3-2.16= (0.84)(0.84)= 0.7056

0-2.16= (-2.16)(-2.16)= 4.6656

1-2.16= (-1.16)(-1.16)= 1.3456

1-2.16= (-1.16)(-1.16)= 1.3456

3-2.16= (0.84)(0.84)= 0.7056

2-2.16= (-0.16)(-0.16)= 0.0256 

2-2.16= (-0.16)(-0.16)= 0.0256 

2-2.16= (-0.16)(-0.16)= 0.0256 

3-2.16= (0.84)(0.84)= 0.7056

2-2.16= (-0.16)(-0.16)= 0.0256 

1-2.16= (-1.16)(-1.16)= 1.3456

2-2.16= (-0.16)(-0.16)= 0.0256 

2-2.16= (-0.16)(-0.16)= 0.0256 

4-2.16= (1.84)(1.84)= 3.3856

3-2.16= (0.84)(0.84)= 0.7056

3-2.16= (0.84)(0.84)= 0.7056

4-2.16= (1.84)(1.84)= 3.3856

1-2.16= (-1.16)(-1.16)= 1.3456

2-2.16= (-0.16)(-0.16)= 0.0256 

2-2.16= (-0.16)(-0.16)= 0.0256 


Σ= 29.3856


σ2 = 29.3856/25-1

σ2 = 29.3856/24

σ2 = 1.2244


En tercer lugar, aprendí a calcular la Desviación típica o estándar. Ésta es la raíz cuadrada de la varianza y su notación es: σ o s, según sea muestra o población respectivamente. Así continuando con el ejemplo anterior, la desviación estándar sería:

σ2 = 1.2244

σ= √ 1.2244

σ= 1.1065


En cuarto lugar, aprendí a determinar el coeficiente de variación, su notación es C.V. y su resultado se representa en porcentaje. De tal modo, el coeficiente de variación es el resultado de la división de la desviación estándar entre la Media multiplicado por 100. 

De acuerdo con el ejemplo previamente dado, el coeficiente de variación es:

C.V. = 1.1065/2.16 (100%)

C.V. = 0.5122 (100%)

C.V. = 51.22 %


Entonces, las Medidas de Dispersión se calculan de manera muy sencilla como se puede ver en los ejemplos. Así, no se debe olvidar que las Medidas de Dispersión son lo "contrario" a las MTC, ya que las MTC nos indican qué está sucediendo en el centro de la base de datos, mientras que las Medidas de Dispersión nos permiten ver que tan separados están los valores respecto a la Media, lo que nos deja saber la variabilidad de la muestra.

Evidencia 14 (19-Octubre)
Hoy en la clase de Estadística Descriptiva en Educación, continúe reafirmando mis conocimientos acerca de las Medidas de Dispersión: varianza, desviación estándar y coeficiente de variación. Por otra parte, aprendí a realizar la interpretación para dichas medidas, así se establece que la interpretación se hace utilizando el coeficiente de variación (C.V.) ya que este dato nos permite conocer de una manera más exacta la variabilidad existente dentro de nuestra base de datos (muestra). Asimismo, aprendí que cuando el resultado del coeficiente de variación es superior al 100% (recordemos que esta medida se representa en porcentaje) se dice que es un dato irrelevante y comúnmente no tiene interpretación. Del mismo modo, la interpretación suele ser diferente cuando tenemos una variabilidad de 0, esto puede deberse básicamente a que los datos muestrales son iguales. Con respecto a lo anterior, veamos los siguientes ejemplos:

1) Cuando el coeficiente de variación es superior o igual a 1% e inferior o igual a 100%:
Supongamos que tenemos los siguientes resultados en las Medidas de Dispersión:

σ2 = 1.2244

σ= 1.1065

C.V. = 1.1065/2.16 (100%) = 51.22 %


La interpretación sería: "Existe una variación de 51.22 % de los datos con respecto a su media."

2) Cuando tenemos una variabilidad de 0: 

Suponiendo que tenemos los siguientes datos: 
6, 6, 6, 6, 6,6

X= 36/6= 6


6-6= (0)(0)= 0 

6-6= (0)(0)= 0 

6-6= (0)(0)= 0 

6-6= (0)(0)= 0 

6-6= (0)(0)= 0 

6-6= (0)(0)= 0 


σ2= 0/5= 0

σ= √0= 0

C.V.= 0/6(100%)= 0


Así, podemos ver que todas las Medidas de Dispersión tienen como resultado cero. Entonces, la interpretación sería: "No existe variación de los datos con respecto a su media." 

De tal manera, podemos ver que el coeficiente de variación nos da la posibilidad de hacer una comparación entre los datos y conocer (como lo dicen las interpretaciones) dónde se encuentra mayor variación de los valores en relación a su media. Por otro lado, es probable que en ocasiones el rango y el coeficiente de variación coincidan en el resultado de mayor dispersión de los datos, no obstante esto no es siempre, además recordemos que el rango es poco utilizado debido a que sólo ocupa 2 de los valores muestrales ignorando a los demás. 

Finalmente, reafirme que las Medidas de Dispersión, sobre todo el C.V., nos permiten hacer comparaciones entre distintas bases de datos. 

Evidencia 15 (26-Octubre)
En la clase del día de hoy continuamos revisando las Medidas de Dispersión, así de acuerdo a lo que el equipo expositor nos explicó, entendí que estas medidas nos permiten conocer qué tan alejados se encuentran los valores de una muestra con respecto a su media. Asimismo, reafirme los conceptos sobre los 4 tipos de medidas de dispersión; entonces el RANGO es la diferencia entre el mayor y el menor de los valores que toma una variable estadística; la VARIANZA nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central, ese promedio es calculado elevando cada una de las diferencias al cuadrado (con el propósito de eliminar los signos negativos, si es que resultan) y, posteriormente, calculando su media.
La DESVIACIÓN ESTÁNDAR O TÍPICA es la raíz cuadrada de la varianza la cual mide qué tanto se separan los datos, recordemos que cuanto mayor sea la dispersión mayor es la desviación estándar, puesto que si no hubiese variación en los datos, es decir que todos fuesen iguales, la desviación estándar sería igual a cero; por último, el COEFICIENTE DE VARIACIÓN es la medida que nos permite hacer una comparación entre diversas bases de datos, éste es el resultado de la división entre la desviación estándar y la media de la muestra multiplicada por cien y representada en porcentaje.
Respecto a las definiciones anteriores y para comprender mejor el tema, veamos el siguiente ejemplo:
“A los alumnos de un grupo de 6° año de primaria se les aplicó un examen con la finalidad de evaluar el primer bimestre, las calificaciones fueron las siguientes:
7.2, 4.5, 6.6, 8.9, 9.3, 5.0, 7.2, 8.0, 8.9, 7.2, 9.3, 9.0, 8.5, 8.9, 7.5, 7.2, 6.6, 6.0, 9.0, 9.3, 9.3, 9.0, 7.2, 6.6, 8.5

Se desea conocer la dispersión existente entre las calificaciones de los alumnos, para ello se deben calcular las Medidas de Dispersión y darle una interpretación.”


1) VARIANZA

Ẋ = 7.2 + 4.5 + 6.6 + 8.9 + 9.3 + 5.0 + 7.2 + 8.0 + 8.9 + 7.2 + 9.3 + 9.0 + 8.5 + 8.9 + 7.5 + 7.2 + 6.6 + 6.0 + 9.0 + 9.3 + 9.3 + 9.0 + 7.2 + 6.6 + 8.5/25

Ẋ = 194.7/25 = 7.788
7.2 - 7.788 =(-0.588)2 = 0.3457
4.5 - 7.788 = (-3.288)2 = 10.8109
6.6 - 7.788 =(-1.188)2 =1.4113
8.9 - 7.788 =(1.112)2 =1.2365
9.3 - 7.788 =(1.512)2 =2.2861
5.0 - 7.788 = (-2.788)2 =7.7729
7.2 - 7.788 =(-0.588)2 =0.3457
8.0 - 7.788 =(0.212)2 =0.0449
8.9 - 7.788 =(1.112)2  =1.2365
7.2 - 7.788 =(-0.588)2 =0.3457
9.3 - 7.788 =(1.512)2 =2.2861
9.0 - 7.788 =(1.212)2 = 1.4689
8.5 - 7.788 =(0.712)2 = 0.5069
8.9 - 7.788 =(1.112)2 =1.2365
7.5 - 7.788 =(-0.288)2 =0.0829
7.2 - 7.788 = (-0.588)2 =0.3457
6.6 - 7.788 =(-1.188)2 =1.4113
6.0 - 7.788 =(-1.788)2 = 3.1969
9.0 - 7.788 =(1.212)2 =1.4689
9.3 - 7.788 =(1.512)2 =2.2861
9.3 - 7.788 =(1.512)2 =2.2861
9.0 - 7.788 =(1.212)2 =1.4689
7.2 - 7.788 =(-0.588)2 = 0.3457
6.6 - 7.788 =(-1.188)2 =1.4113
8.5 - 7.788 =(0.712)2 =0.5069

σ2 = 46.1453/25-1 = 46.1453/24 = 1.9227
2) DESVIACIÓN ESTÁNDAR
σ= √σ2
σ =√1.9227 =1.3866

3) COEFICIENTE DE VARIACIÓN
C.V. = σ/x(100%)
C.V. = 1.3866/7.788 (100%)
C.V. = 0.1780431 (100%)
C.V. = 17.8043 %
Interpretación: “Existe una variación de 17.8043% de los datos con respecto al valor de la media.”
De tal modo, podemos observar la importancia de las Medidas de Dispersión las cuales siempre van a tener una relación con la Media (una de las Medidas de Tendencia Central) con el fin de comparar los resultados dentro de la muestra e incluso, comparar entre sí diversas muestras, para que de esta manera conozcamos su variabilidad y determinemos cómo es que se están comportando los datos estudiados.
Evidencia 16 (31-Octubre)
En la clase de hoy de Estadística, volvimos a abordar el tema de las Medidas de Dispersión (varianza, desviación estándar y coeficiente de variación), asimismo revisamos las Medidas de Tendencia Central (media, mediana y moda) al realizar un ejercicio donde teníamos que determinar dichas medidas. No se debe olvidar que ambos tipos de medidas son muy esenciales dentro de los estudios y análisis estadísticos, puesto que tanto las MTC como las Medidas de Dispersión nos permiten conocer desde diferentes perspectivas cómo es que se están comportando los datos, así las MTC corresponden a valores que se encuentran en la parte central de un conjunto de datos, mientras que las Medidas de Dispersión son los valores numéricos que indican la manera en que los datos están diseminados con respecto a un valor central.
Como vemos, ambas medidas guardan una estrecha relación y a su vez se complementan, ya que las dos nos dan la oportunidad de obtener resultados concisos y confiables, al igual que nos dejan dar diversas interpretaciones con respecto al conjunto de datos observado, así con dichas interpretaciones es mucho más fácil hacer comparaciones y posteriormente obtener conclusiones para comprender la manera cómo podemos intervenir si es que alguna problemática se estuviese presentado en la muestra estudiada.
De tal modo, para reafirmar los conocimientos sobre ambas medidas, tenemos el siguiente pequeño ejemplo:
“Las calificaciones de 8 alumnos de 5° de primaria en su primer examen de español, fueron las siguientes:
6.2, 9.7, 5.5, 8.2, 8.2, 8.9, 9.3, 7.5
a) Determinar las Medidas de Tendencia Central para datos agrupados y sus respectivas interpretaciones.
b) Obtener las Medidas de Dispersión y su interpretación.”
---MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS---
MEDIA
9.7-5.5= 4.2/4= 1.05= 1.0501
Clase……………….…FA……………………Fa………..Mc…………….Mc*Fi
(5.5-6.5501]……………2……………………..2……….6.0250…………12.0500
(6.5501-7.6002]………..1……………………..3……….7.0751…………7.0751
(7.6002-8.6503]………..2……………………..5……….8.1252…………16.2504
(8.6503-9.7004]………..3……………………..8…….…9.1753………...27.5259

Σ= 62.9014
Ẋ=  62.9014/8= 7.8626
Interpretación: “Si todos los alumnos tuvieran la misma calificación, ésta sería de 7.8626”
MEDIANA
8 –PAR
n/2 = 8/2 = 4° y 5° (posiciones en Fa)
Me= (7.6002-8.6503]—Mc =8.1252
Interpretación: “El 50 % de los alumnos obtuvo una calificación inferior a 8.1252, el otro 50% obtuvo una calificación superior a 8.1252”
CLASE MODAL
Mo= (8.6503-9.7004]
Interpretación: “La mayoría de los alumnos obtuvo una calificación entre 8.6503 y 9.7004”
---MEDIDAS DE DISPERSIÓN---
RANGO = 9.7-5.5= 4.2
VARIANZA
Ẋ=  7.8626
6.2-7.8626= (-1.6626) (-1.6626)= 2.7642
9.7-7.8626= (1.8374) (1.8374)= 3.3760
5.5-7.8626= (-2.3626) (-2.3626)= 5.5818
8.2-7.8626= (0.3374) (0.3374)= 0.1138
8.2-7.8626= (0.3374) (0.3374)= 0.1138
8.9-7.8626= (1.0374) (1.0374)= 1.0761
9.3-7.8626= (1.4374) (1.4374)= 2.0661
7.5-7.8626= (-0.3626) (-0.3626)= 0.1314
Ϭ2=  27.1728/7 = 3.8818
DESVIACIÓN ESTÁNDAR
Ϭ2=  3.8818
Ϭ= √3.8818 = 1.9702
COEFICIENTE DE VARIACIÓN
C.V. = 1.9702/ 7.8626 (100%)
C.V. = 0.2505786 (100%)
C.V. = 25.0578 %
Interpretación: “Existe una variación de 25.0578 % de los datos con respecto al valor de la media”

No hay comentarios:

Publicar un comentario