MEDIDAS DE DISPERSIÓN
Evidencia 13 (17-Octubre)
El día de hoy en la clase de estadística aprendí a
calcular las Medidas de Dispersión. Éstas, a diferencia de las Medidas de
Tendencia Central, hacen referencia a "los valores numéricos que describen
la forma en que las observaciones están dispersas o distribuidas con respecto
al valor central". En otras palabras, las Medidas de Dispersión nos
indican cuan "esparcidos" se encuentran los datos o valores en relación a
la Media. Asimismo, aprendí las 4 diferentes Medidas de Dispersión.
En primer lugar: el rango. Se define como la amplitud de la base de datos, y está determinado por los dos valores extremos de la muestra. El rango se determina restando el dato mayor menos el dato menor, por ejemplo:
"Las edades de los niños con mayor rezago escolar de la escuela primaria Benito Juárez del turno vespertino son:
7, 6, 8, 9, 6, 6, 7, 7, 8, 9, 6, 6, 6, 6, 7, 8, 6, 6, 6, 7, 9, 6, 6, 7, 7, 7, 6, 7, 6, 6, 6, 7, 8, 9, 6, 6, 6, 6, 8, 7, 6, 10, 7, 8, 7, 7, 7, 9."
Calcular el rango:
R= 10-6 = 4
Así, el rango es la Medida de Dispersión mas sencilla de calcular, no obstante, casi no se emplea debido a que sólo usa dos de los valores y los demás prácticamente los excluye.
En segundo lugar, aprendí a determinar la varianza. Ésta es el "promedio al cuadrado de las desviaciones de cada dato con respecto a la media." La varianza se representa como s2 cuando se trata de una población, y como σ2 cuando estamos trabajando con una muestra.
El procedimiento para calcular la varianza es el siguiente:
1) A cada valor se le resta el valor de la Media, y después se multiplica por sí mismo (es decir, se eleva al cuadrado).
2) Se hace la sumatoria de cada resultado que hayamos obtenido del paso anterior.
3) Ahora, se divide el resultado de la sumatoria entre el total de datos menos 1.
Para entender el procedimiento tenemos el siguiente ejemplo:
"Se desea conocer el número de hijos que tienen los trabajadores de una empresa, para ello se encuestó a algunos de ellos, obteniendo los siguientes resultados:
3, 4, 2, 0, 2, 3, 0, 1, 1, 3, 2, 2, 2, 3, 2, 1, 2, 2, 4, 3, 3, 4, 1, 2, 2."
Calcular la varianza:
x = 54/25 = 2.16
3-2.16= (0.84)(0.84)= 0.7056
4-2.16= (1.84)(1.84)= 3.3856
2-2.16= (-0.16)(-0.16)= 0.0256
0-2.16= (-2.16)(-2.16)= 4.6656
2-2.16= (-0.16)(-0.16)= 0.0256
3-2.16= (0.84)(0.84)= 0.7056
0-2.16= (-2.16)(-2.16)= 4.6656
1-2.16= (-1.16)(-1.16)= 1.3456
1-2.16= (-1.16)(-1.16)= 1.3456
3-2.16= (0.84)(0.84)= 0.7056
2-2.16= (-0.16)(-0.16)= 0.0256
2-2.16= (-0.16)(-0.16)= 0.0256
2-2.16= (-0.16)(-0.16)= 0.0256
3-2.16= (0.84)(0.84)= 0.7056
2-2.16= (-0.16)(-0.16)= 0.0256
1-2.16= (-1.16)(-1.16)= 1.3456
2-2.16= (-0.16)(-0.16)= 0.0256
2-2.16= (-0.16)(-0.16)= 0.0256
4-2.16= (1.84)(1.84)= 3.3856
3-2.16= (0.84)(0.84)= 0.7056
3-2.16= (0.84)(0.84)= 0.7056
4-2.16= (1.84)(1.84)= 3.3856
1-2.16= (-1.16)(-1.16)= 1.3456
2-2.16= (-0.16)(-0.16)= 0.0256
2-2.16= (-0.16)(-0.16)= 0.0256
Σ= 29.3856
σ2 = 29.3856/25-1
σ2 = 29.3856/24
σ2 = 1.2244
En tercer lugar, aprendí a calcular la Desviación típica o estándar. Ésta es la raíz cuadrada de la varianza y su notación es: σ o s, según sea muestra o población respectivamente. Así continuando con el ejemplo anterior, la desviación estándar sería:
σ2 = 1.2244
σ= √ 1.2244
σ= 1.1065
En cuarto lugar, aprendí a determinar el coeficiente de variación, su notación es C.V. y su resultado se representa en porcentaje. De tal modo, el coeficiente de variación es el resultado de la división de la desviación estándar entre la Media multiplicado por 100.
De acuerdo con el ejemplo previamente dado, el coeficiente de variación es:
C.V. = 1.1065/2.16 (100%)
C.V. = 0.5122 (100%)
C.V. = 51.22 %
Entonces, las Medidas de Dispersión se calculan de manera muy sencilla como se puede ver en los ejemplos. Así, no se debe olvidar que las Medidas de Dispersión son lo "contrario" a las MTC, ya que las MTC nos indican qué está sucediendo en el centro de la base de datos, mientras que las Medidas de Dispersión nos permiten ver que tan separados están los valores respecto a la Media, lo que nos deja saber la variabilidad de la muestra.
Evidencia 14 (19-Octubre)
Hoy en la clase de Estadística
Descriptiva en Educación, continúe reafirmando mis conocimientos acerca de las
Medidas de Dispersión: varianza, desviación estándar y coeficiente de
variación. Por otra parte, aprendí a realizar la interpretación para dichas
medidas, así se establece que la interpretación se hace utilizando el
coeficiente de variación (C.V.) ya que este dato nos permite conocer de una
manera más exacta la variabilidad existente dentro de nuestra base de datos
(muestra). Asimismo, aprendí que cuando el resultado del coeficiente de
variación es superior al 100% (recordemos que esta medida se representa en
porcentaje) se dice que es un dato irrelevante y comúnmente no tiene
interpretación. Del mismo modo, la interpretación suele ser diferente cuando
tenemos una variabilidad de 0, esto puede deberse básicamente a que los datos
muestrales son iguales. Con respecto a lo anterior, veamos los siguientes
ejemplos:
1) Cuando el coeficiente de variación es superior o igual a 1% e inferior o igual a 100%:
Supongamos que tenemos los siguientes resultados en
las Medidas de Dispersión:
σ2 = 1.2244
σ2 = 1.2244
σ= 1.1065
C.V. = 1.1065/2.16 (100%) = 51.22 %
La interpretación sería: "Existe una variación de 51.22 % de los datos con respecto a su media."
2) Cuando tenemos una variabilidad de 0:
Suponiendo que tenemos los siguientes datos:
6, 6, 6, 6, 6,6
X= 36/6= 6
6-6= (0)(0)= 0
6-6= (0)(0)= 0
6-6= (0)(0)= 0
6-6= (0)(0)= 0
6-6= (0)(0)= 0
6-6= (0)(0)= 0
σ2= 0/5= 0
σ= √0= 0
C.V.= 0/6(100%)= 0
Así, podemos ver que todas las Medidas de Dispersión tienen como resultado cero. Entonces, la interpretación sería: "No existe variación de los datos con respecto a su media."
De tal manera, podemos ver que el coeficiente de variación nos da la posibilidad de hacer una comparación entre los datos y conocer (como lo dicen las interpretaciones) dónde se encuentra mayor variación de los valores en relación a su media. Por otro lado, es probable que en ocasiones el rango y el coeficiente de variación coincidan en el resultado de mayor dispersión de los datos, no obstante esto no es siempre, además recordemos que el rango es poco utilizado debido a que sólo ocupa 2 de los valores muestrales ignorando a los demás.
Finalmente, reafirme que las Medidas de Dispersión, sobre todo el C.V., nos permiten hacer comparaciones entre distintas bases de datos.
Evidencia 15 (26-Octubre)
En la clase del día de hoy
continuamos revisando las Medidas de Dispersión, así de acuerdo a lo que el
equipo expositor nos explicó, entendí que estas medidas nos permiten conocer
qué tan alejados se encuentran los valores de una muestra con respecto a su media.
Asimismo, reafirme los conceptos sobre los 4 tipos de medidas de dispersión;
entonces el RANGO es la diferencia entre el mayor y el menor de los valores que
toma una variable estadística; la VARIANZA nos permite identificar la
diferencia promedio que hay entre cada uno de los valores respecto a su punto
central, ese promedio es calculado elevando cada una de las diferencias al
cuadrado (con el propósito de eliminar los signos negativos, si es que
resultan) y, posteriormente, calculando su media.
La DESVIACIÓN ESTÁNDAR O
TÍPICA es la raíz cuadrada de la varianza la cual mide qué tanto se separan los
datos, recordemos que cuanto mayor sea la dispersión mayor es la desviación
estándar, puesto que si no hubiese variación en los datos, es decir que todos fuesen
iguales, la desviación estándar sería igual a cero; por último, el COEFICIENTE
DE VARIACIÓN es la medida que nos permite hacer una comparación entre diversas
bases de datos, éste es el resultado de la división entre la desviación
estándar y la media de la muestra multiplicada por cien y representada en
porcentaje.
Respecto a las definiciones
anteriores y para comprender mejor el tema, veamos el siguiente ejemplo:
“A los alumnos de un grupo
de 6° año de primaria se les aplicó un examen con la finalidad de evaluar el
primer bimestre, las calificaciones fueron las siguientes:
7.2,
4.5, 6.6, 8.9, 9.3, 5.0, 7.2, 8.0, 8.9, 7.2, 9.3, 9.0, 8.5, 8.9, 7.5, 7.2, 6.6,
6.0, 9.0, 9.3, 9.3, 9.0, 7.2, 6.6, 8.5
Se
desea conocer la dispersión existente entre las calificaciones de los alumnos,
para ello se deben calcular las Medidas de Dispersión y darle una
interpretación.”
1) VARIANZA
Ẋ
= 7.2 + 4.5 + 6.6 + 8.9 + 9.3 + 5.0 + 7.2 + 8.0 + 8.9 + 7.2 + 9.3 + 9.0 + 8.5 +
8.9 + 7.5 + 7.2 + 6.6 + 6.0 + 9.0 + 9.3 + 9.3 + 9.0 + 7.2 + 6.6 + 8.5/25
Ẋ = 194.7/25 = 7.788
7.2
- 7.788 =(-0.588)2 = 0.3457
4.5
- 7.788 = (-3.288)2 = 10.8109
6.6
- 7.788 =(-1.188)2 =1.4113
8.9
- 7.788 =(1.112)2 =1.2365
9.3
- 7.788 =(1.512)2 =2.2861
5.0
- 7.788 = (-2.788)2 =7.7729
7.2
- 7.788 =(-0.588)2 =0.3457
8.0
- 7.788 =(0.212)2 =0.0449
8.9
- 7.788 =(1.112)2 =1.2365
7.2
- 7.788 =(-0.588)2 =0.3457
9.3
- 7.788 =(1.512)2 =2.2861
9.0
- 7.788 =(1.212)2 = 1.4689
8.5
- 7.788 =(0.712)2 = 0.5069
8.9
- 7.788 =(1.112)2 =1.2365
7.5
- 7.788 =(-0.288)2 =0.0829
7.2
- 7.788 = (-0.588)2 =0.3457
6.6
- 7.788 =(-1.188)2 =1.4113
6.0
- 7.788 =(-1.788)2 = 3.1969
9.0
- 7.788 =(1.212)2 =1.4689
9.3
- 7.788 =(1.512)2 =2.2861
9.3
- 7.788 =(1.512)2 =2.2861
9.0
- 7.788 =(1.212)2 =1.4689
7.2
- 7.788 =(-0.588)2 = 0.3457
6.6
- 7.788 =(-1.188)2 =1.4113
8.5
- 7.788 =(0.712)2 =0.5069
σ2 = 46.1453/25-1 = 46.1453/24 = 1.9227
2) DESVIACIÓN ESTÁNDAR
σ=
√σ2
σ
=√1.9227 =1.3866
3) COEFICIENTE DE VARIACIÓN
C.V. = σ/x(100%)
C.V. = 1.3866/7.788 (100%)
C.V. = 0.1780431 (100%)
C.V.
= 17.8043 %
Interpretación:
“Existe una variación de 17.8043% de los datos con respecto al valor de la
media.”
De
tal modo, podemos observar la importancia de las Medidas de Dispersión las
cuales siempre van a tener una relación con la Media (una de las Medidas de Tendencia
Central) con el fin de comparar los resultados dentro de la muestra e incluso,
comparar entre sí diversas muestras, para que de esta manera conozcamos su
variabilidad y determinemos cómo es que se están comportando los datos
estudiados.
Evidencia
16 (31-Octubre)
En la clase de hoy de
Estadística, volvimos a abordar el tema de las Medidas de Dispersión (varianza,
desviación estándar y coeficiente de variación), asimismo revisamos las Medidas
de Tendencia Central (media, mediana y moda) al realizar un ejercicio donde
teníamos que determinar dichas medidas. No se debe olvidar que ambos tipos de
medidas son muy esenciales dentro de los estudios y análisis estadísticos,
puesto que tanto las MTC como las Medidas de Dispersión nos permiten conocer
desde diferentes perspectivas cómo es que se están comportando los datos, así
las MTC corresponden a valores que se encuentran en la parte central de un
conjunto de datos, mientras que las Medidas de Dispersión son los valores
numéricos que indican la manera en que los datos están diseminados con respecto
a un valor central.
Como vemos, ambas medidas
guardan una estrecha relación y a su vez se complementan, ya que las dos nos
dan la oportunidad de obtener resultados concisos y confiables, al igual que
nos dejan dar diversas interpretaciones con respecto al conjunto de datos
observado, así con dichas interpretaciones es mucho más fácil hacer
comparaciones y posteriormente obtener conclusiones para comprender la manera
cómo podemos intervenir si es que alguna problemática se estuviese presentado
en la muestra estudiada.
De tal modo, para reafirmar
los conocimientos sobre ambas medidas, tenemos el siguiente pequeño ejemplo:
“Las calificaciones de 8
alumnos de 5° de primaria en su primer examen de español, fueron las siguientes:
6.2, 9.7, 5.5, 8.2, 8.2,
8.9, 9.3, 7.5
a) Determinar las Medidas de
Tendencia Central para datos agrupados y sus respectivas interpretaciones.
b) Obtener las Medidas de
Dispersión y su interpretación.”
---MEDIDAS DE TENDENCIA
CENTRAL PARA DATOS AGRUPADOS---
MEDIA
9.7-5.5= 4.2/4= 1.05= 1.0501
Clase……………….…FA……………………Fa………..Mc…………….Mc*Fi
(5.5-6.5501]……………2……………………..2……….6.0250…………12.0500
(6.5501-7.6002]………..1……………………..3……….7.0751…………7.0751
(7.6002-8.6503]………..2……………………..5……….8.1252…………16.2504
(8.6503-9.7004]………..3……………………..8…….…9.1753………...27.5259
Σ= 62.9014
Ẋ= 62.9014/8= 7.8626
Interpretación: “Si todos
los alumnos tuvieran la misma calificación, ésta sería de 7.8626”
MEDIANA
8 –PAR
n/2 = 8/2 = 4° y 5°
(posiciones en Fa)
Me= (7.6002-8.6503]—Mc =8.1252
Interpretación: “El 50 % de
los alumnos obtuvo una calificación inferior a 8.1252, el otro 50% obtuvo una
calificación superior a 8.1252”
CLASE MODAL
Mo= (8.6503-9.7004]
Interpretación: “La mayoría
de los alumnos obtuvo una calificación entre 8.6503 y 9.7004”
---MEDIDAS DE DISPERSIÓN---
RANGO = 9.7-5.5= 4.2
VARIANZA
Ẋ= 7.8626
6.2-7.8626= (-1.6626)
(-1.6626)= 2.7642
9.7-7.8626= (1.8374)
(1.8374)= 3.3760
5.5-7.8626= (-2.3626)
(-2.3626)= 5.5818
8.2-7.8626= (0.3374)
(0.3374)= 0.1138
8.2-7.8626= (0.3374) (0.3374)=
0.1138
8.9-7.8626= (1.0374)
(1.0374)= 1.0761
9.3-7.8626= (1.4374)
(1.4374)= 2.0661
7.5-7.8626= (-0.3626)
(-0.3626)= 0.1314
Ϭ2= 27.1728/7 = 3.8818
DESVIACIÓN ESTÁNDAR
Ϭ2= 3.8818
Ϭ= √3.8818 = 1.9702
COEFICIENTE DE VARIACIÓN
C.V. = 1.9702/ 7.8626 (100%)
C.V. = 0.2505786 (100%)
C.V. = 25.0578 %
Interpretación: “Existe una
variación de 25.0578 % de los datos con respecto al valor de la media”
No hay comentarios:
Publicar un comentario