MEDIDAS DE TENDENCIAL CENTRAL PARA DATOS
AGRUPADOS
Evidencia 6 (21-Septiembre)
En
la clase de este día (como en algunas de las anteriores) reafirme conocimientos
sobre Medidas de Tendencia Central. Asimismo, he notado que mi aprendizaje se ha hecho más
significativo a partir de la conformación por equipos, es de este modo que la
retroalimentación de los conocimientos
es mayor al momento en que cada uno de los integrantes de nuestro equipo
participa, al mismo tiempo que hacemos del trabajo colaborativo algo mucho más
ameno, y de cierta forma, divertido.
Por
otra parte, hoy aprendí cómo elaborar una tabla que nos permite agrupar los
datos; ésta se emplea generalmente cuando las variables toman un numero grande
de valores, o bien, cuando se trata de variables continuas. Entonces, para
proceder a agrupar los valores debemos usar los intervalos los cuales deben
tener una “amplitud” semejante, a dicha amplitud se le conoce como clase, por
esta razón decimos que se trata de INTERVALOS DE CLASE.
Los
intervalos que hemos de utilizar para agrupar han de determinarse por el número
de datos que tengamos en nuestra base (de datos). En otras palabras, de acuerdo
al número de datos que tengamos, serán los intervalos que realicemos.
Ahora
bien, para obtener los intervalos correspondientes a nuestros valores debemos:
1) Identificar el valor menor y el mayor (dato) de nuestra
base de datos.
2) Una vez identificados hay que hacer una RESTA; al valor
mayor le restaremos el valor menor.
3) De la resta obtendremos un número, el cual se debe
DIVIDIR con el total de intervalos que vayamos a hacer; el
resultado de dicha división lo llamaremos “constante”. Asimismo, el número que
hayamos obtenido (constante) debe contar con 4 decimales después del
punto, de tal manera, al último decimal le hemos de aumentar 1.
4) Después procederemos
a SUMAR la constante más el valor menor de nuestra base de datos; así
obtendremos nuestro primer intervalo, el cual ha de representarse como
(LÍMITE 1– LÍMITE 2). Para el segundo
intervalo, hemos de SUMAR el segundo límite del primer intervalo (el cual se convertirá en limite
1), más la constante lo cual nos determinará el límite 2 del segundo intervalo.
En resumen, el límite 2 siempre se va a
“bajar” tomando el lugar del límite 1, y el límite 2 del nuevo intervalo se obtendrá una vez que sumemos el límite
1 más la constante.
Para comprender mejor los pasos anteriores, veamos
el ejemplo:
Tenemos una base de datos con los siguientes valores:
18.41, 18.36, 18. 29, 18. 41, 18.31, 18.24, 18.22, 18.27,
18.29, 18.38, 18.44, 18.40, 18.57, 18.22, 18.26, 18.23, 18.34, 18.20, 18.43,
18.35, 18.42, 18.36, 18.21, 18.33, 18.44, 18.40
1) El valor menor es 18.20; el valor mayor es 18.57.
2) 18.57 – 18.20 = 0.37
3) 0.37/6 = 0.0616 (al último decimal de agregamos +1) =
0.0617 (este número es nuestra constante)
4) 18.20 + 0.0617 = 18.2617
Nuestro primer intervalo se representará: 18.20 – 18.2617
Para el segundo intervalo sumaremos 18.2617 + 0.0617 =
18.3234 (el resultado será nuestro límite 2); entonces este intervalo se
representará: 18.2617 – 18.3234
Así, realizando las correspondientes sumas, nuestros 6
intervalos serán:
18.20 – 18.2617
18.2617 - 18.3234
18.3234 – 18.3851
18.3851 – 18.4468
18.4468 – 18.5085
18.5085 – 18.5702
Una vez obtenidos todos los intervalos, debemos
determinar cuántos valores de nuestra base de datos hay para cada intervalo,
esto lo llamaremos como Frecuencia Absoluta para datos agrupados. Si en esta FA
para datos agrupados tenemos como resultado el total de valores de nuestra base
de datos, diremos que habremos posicionado bien a dichos valores según su
intervalo.
Primero, en la realización de los intervalos o clases para una base de datos, aprendí que a las constantes SIEMPRE se les debe sumar 1, ya sea que se trate de un número decimal o un número entero. Sabemos que si es decimal, por lo general se represen
(Suponiendo que es un 3)
1) Colocar el número, después el punto, luego tres ceros y al último un 1. Lo cual se representa como sigue: 3.0001
2) O bien, podemos colocar el número, después el punto y luego un 1. Lo cual quedaría representado así: 3.1
Segundo, para calcular la Mediana para datos agrupados aprendí que puede haber ocasiones en que los intervalos que obtengamos sean 2, y por consiguiente sean 2 las marcas de clase. Esto se debe principalmente que al momento de buscar las posiciones centrales de nuestra base de datos, éstas se encuentren en dos Fa acumuladas, por ejemplo:
Tenemos una muestra o base de datos con 250 valores, para saber las posiciones centrales que habremos de buscar en la columna de la Fa acumulada procedemos a dividir 250 entre 2 (n/2), cuyo resultado sería 125, sin embargo como la muestra es número par no sólo usaríamos la posición 125° sino que también la 126°. Entonces en la Fa acumulada buscaríamos el número donde 125 y 126 “entren”. Supongamos que en dicha Fa acumulada, tenemos los siguientes valores, con sus respectivos intervalos:
INTERVALOS................... FA ACUMULADA
(1.13-1.1678]..................2
(1.1678-1.2056]..............34
(1.2056-1.2434]..............57
(1.2434-1.2812]..............89
(1.2812-1.3190]..............125
(1.3190-1.3568]..............184
(1.3568-1.3946]..............211
(1.3946-1.4324]..............246
(1.4324-1.4702]..............250
Como vemos en la Fa acumulada tenemos un 125 cuyo intervalo es (1.2812-1.3190], el punto aquí es que el 126 ya no entra ahí, sino en el valor debajo de 125, que es 184, y cuyo intervalo es (1.3190-1.3568].
Entonces cuando se nos presentan este tipo de ocasiones, nuestra Mediana deberá representarse con los dos intervalos, así:
Me = (1.2812-1.3190], (1.3190-1.3568].
El problema sería al momento de darle su interpretación, pues tendríamos 2 marcas de clase. Cuando esto ocurra lo que debemos hacer para tener 1 sola marca de clase, es sumar el primer valor del primer intervalo más el segundo valor del segundo intervalo y dividirlo entre 2, lo que quedaría como:
1.2812+1.3568/2 = 1.3190
De tal modo a partir de dicho resultado, nuestra interpretación quedaría como, por ejemplo:
Mediana: “El 50% de los alumnos encuestados tienen una estatura inferior a 1.3190 metros, el otro 50% de los alumnos tienen una estatura superior a 1.3190 metros.”
Tercero, lo que también aprendí fueron algunas definiciones para las Medidas de Tendencia Central para datos agrupados, las cuales fueron dadas por el equipo expositor, así las definieron:
MEDIA: se refiere cuando los datos que se presentan en una distribución de frecuencias caen dentro de un intervalo de clase.
Asimismo definieron:
HISTOGRAMA: se refiere al conjunto de rectángulos que tienen sus bases en el eje X (horizontal), y en cuyos centros están las marcas de clase para formar la línea poligonal.
MEDIDAS
DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
Evidencia 8 (28-Septiembre)
El día de hoy en la clase de
Estadística, aprendí varias cosas. Lo más importante para mí, fue saber cómo
obtener las Medidas de Tendencia Central para datos agrupados; esto tiene una
estrecha relación con lo que habíamos revisado en la clase de la semana pasada,
aquella donde aprendimos a determinar los intervalos o las clases para agrupar
datos.
De tal modo las MTC para
datos agrupados siguen siendo la Media, Mediana y Moda. Primero, aprendí que
para obtener la MEDIA debemos hacer un
procedimiento o seguir una serie de pasos muy sencillos:
1)
De nuestra base de datos; después de que ya
obtuvimos los intervalos, y con éstos la Frecuencia Absoluta, la Frecuencia
Relativa con sus respectivas representaciones (decimal y porcentaje) y la
Frecuencia Absoluta acumulada; debemos sacar la MARCA DE CLASE de cada
intervalo, la cual se determina SUMANDO los dos valores de nuestro intervalo y
después dividiendo el resultado entre 2, así se realiza para cada intervalo que
tengamos.
Un
tip importante para rectificar si nuestras marcas de clase son correctas:
podemos sumar por separado cada marca de clase más la constante que hayamos
obtenido en el momento en que hayamos determinado nuestros intervalos.
2)
Posteriormente, cada marca de clase se
MULTIPLICARA por su respectiva FA. (Mc*Fi).
3)
Los resultados de cada multiplicación (Mc*Fi)
se SUMARAN.
4)
Después de que hemos hecho la sumatoria de
(Mc*Fi), ésta la vamos a DIVIDIR entre el número total de datos (NO de
intervalos). Y ese resultado será nuestra media para datos agrupados.
Segundo, también aprendí
cómo determinar la CLASE MODAL (moda). Esta resulta muy fácil de obtener ya que
sólo debemos regresar a la tabla de frecuencias, ahí en la columna de la FA
veremos que dato tiene mayor frecuencia. Así, la CLASE MODAL será nuestro INTERVALO
(NO la frecuencia que tenga éste).
Tercero, aprendí cómo sacar
la MEDIANA; para determinarla únicamente debemos:
1)
Dividir el número total de datos entre 2,
para saber cuál es la mitad de nuestra base de datos.
2)
Recordemos que cuando nuestra base de datos
es PAR la mediana siempre serán 2 números. Por ejemplo, si el total de la
muestra (datos) es 250, éste lo dividimos entre 2 que es igual a 125; como
nuestra base de datos es par, entonces utilizaremos 2 valores centrales que
serían el 125 y 126.
3)
Así, una vez que sabemos los valores de
nuestra base de datos cuyas posiciones se encuentran a la mitad de ésta, nos
remitiremos a ver la columna de la FA ACUMULADA, en esta columna buscaremos el
valor donde puedan “entrar” nuestras posiciones centrales que en este caso son
el 125 y 126. Por ejemplo supongamos que nuestra FA Acumulada tiene los
siguientes valores: 2, 13, 47, 101, 145, 200, 233, 247, 250. Entonces el valor
donde “entran” las posiciones centrales (125 y 126) es en el 145. Una vez visto
que es en el 145 donde corresponden los valores centrales, nos remitiremos a
ver el intervalo del 145. En este caso dicho intervalo será nuestra mediana.
Así,
podemos que decir que una de las funciones de la FA acumulada es que sirve para
obtener la MEDIANA para datos agrupados.
Por último, aprendí algunas
modificaciones de las interpretaciones de las Medidas de Tendencia Central para
datos agrupados. La MEDIA, sigue interpretándose igual como habíamos revisado
en clases anteriores, por ejemplo: “si todos los alumnos de tercer año que
fueron encuestados tuvieran la misma estatura, sería de 1.3019 metros (este
valor fue el resultado de la sumatoria de las FA de cada marca de clase
dividida entre el número total de datos).
La CLASE MODAL (moda)
también se interpreta como lo hemos visto en clases anteriores, sólo que para
datos agrupados utilizamos en intervalo para interpretar la frecuencia con que
más se repiten los datos. Por ejemplo:
“la mayoría de los alumnos de tercer año que fueron encuestados tienen una estatura
entre 1.3190-1.3568 metros.”
Finalmente la interpretación
de la MEDIANA, para mí, es la que cambia un poco. Pues para dicha
interpretación hemos de usar la marca de clase del intervalo que haya sido
nuestra mediana. Por ejemplo, si nuestro intervalo fue 1.2812-1.3190, y nuestra
marca de clase fue 1.3001, entonces nuestra interpretación sería: “el 50 % de
los alumnos tiene una estatura inferior a 1.3001 metros y el otro 50 % tiene
una estatura superior a 1.3001 metros.
NOTA: cuando obtengamos como
mediana 2 intervalos, para determinar el valor como marca de clase, tendremos
que sumar el límite (izquierdo) del primer intervalo obtenido como
mediana, más el límite (derecho) del
otro intervalo. El resultado de esta suma será el valor central que nos permita
dividir la base de datos y hacer nuestra interpretación.
Por último, en esta clase
aprendí cómo graficar un HISTOGRAMA, el cual se utiliza precisamente sólo para
datos agrupados, y cuya característica
principal es que no hay espacio entre cada barra, y en cada una de éstas tenemos una marca de
clase, las cuales uniéndolas nos permiten obtener una línea poligonal
Evidencia 9 (3-Octubre)
El
día de hoy al realizar dos ejercicios
semejantes a los que habíamos visto la clase anterior, únicamente reafirme mis
conocimientos acerca de cómo determinar intervalos y obtener las Medidas de
Tendencial Central para datos
agrupados. Así con los conocimientos que
ya adquirí y que he reafirmado, puedo explicar el siguiente ejercicio, a manera
de ejemplo:
“En
el grupo 32 de la Universidad Pedagógica Nacional 153 Ecatepec se desea saber la cantidad de dinero que
gastan los alumnos en pasaje a la semana, para ello se aplicó una encuesta y se
obtuvieron los siguientes resultados:
$ 130.00 $ 89.50 $ 85.50 $ 60.50
$ 145.00 $ 46.00 $ 118.00 $ 54.00
$ 35.50 $ 40.00 $ 45.50 $ 180.00
$ 96.00
$ 55.50 $ 64.00 $ 115.50
$ 45.50 $ 145.00 $ 133.50 $ 118.00
$ 145.00 $ 76.50 $ 75.00 $ 118.00
$ 118.00 $ 40.00 $ 57.50 $ 96.00
$ 63.50 $ 71.50 $ 96.00 $ 70.00
$ 112.00 $ 93.00 $ 118.00 $ 93.00
$ 57.50 $ 112.00 $ 45.50 $ 118.00
a) Determinar
los intervalos y realizar una tabla de frecuencias con la FA, FR (con sus
respectivas representaciones: decimal y porcentaje) y Fa acumulada.
b) Obtener
las Medidas de Tendencia Central e interpretarlas.
c) Graficar
un histograma para representar los intervalos y su FA.”
a) Para
determinar el intervalo procedemos a encontrar el menor y el mayor valor dentro
de nuestra base de datos, los restamos, dividimos entre el número de intervalos
a realizar, y el resultado será nuestra constante.
180.00
– 35.50 = 144.5/6 = 24.0833 = 24.0834
Para
obtener el primer intervalo sumamos el valor menor más la constante, para los
demás intervalos sumaremos el valor del intervalo anterior más la constante y
así sucesivamente.
Intervalos
35.50-59.5834
59.5834-83.6668
83.6668-107.7502
107.7502-131.8336
131.8336-155.9170
155.9170-180.0004
De los intervalos anteriores determinaremos su
FA y Fa acumulada, así como las Marcas de clase (Mc, la cual es el resultado de
la suma de los dos valores de cada intervalo dividido entre 2) y la Mc*Fi (que
resulta de la multiplicación de Mc por FA). (Véase figura 12). Tanto Mc como
Mc*Fi nos permitirán obtener la Media de nuestra base de datos.
b)
Así una vez conocidos los resultados de Mc*Fi, procederemos a sumar cada uno de
dichos resultados y él numero que
resulte se dividirá entre el número
total de datos. Entonces, la MEDIA es:
Ẋ =
3635.673/40 = 90.8918
Ahora
bien, la siguiente Medida de Tendencia Central a obtener es la CLASE MODAL.
Para ello basta con observar dentro de nuestra tabla cuál es el
intervalo que tiene mayor FA, entonces nuestra CLASE MODAL es:
Mo =
35.50-59.5834
Por
otro lado, es turno de determinar la MEDIANA. Entonces debemos saber si nuestra
base de datos es par o impar. En nuestro ejemplo es PAR, esto quiere decir que
la mediana serán 2 números que estén en las posiciones centrales.
40/2
= 20° y 21°
Así,
la mediana estará en las posiciones 20° y 21° de nuestra base de datos, para
saber el intervalo debemos observar nuestra tabla en la columna de
Fa, y buscar en qué valor de esa columna “caben” el 20 y 21. De tal modo
diremos que es en la tercera fila (25), entonces nuestra MEDIANA es:
Me =
83.6668-107.7502
Una
vez que conocemos las Medidas de Tendencia Central hacemos las
interpretaciones:
MEDIA: Si todos los alumnos
encuestados gastarán la misma cantidad de dinero en su pasaje a la semana,
sería de $ 90.8918 pesos.
CLASE MODAL: La
mayoría de los alumnos del grupo 32 de la UPN 153 Ecatepec gastan en su pasaje
a la semana entre $ 35.50 y $ 59.5834 pesos.
MEDIANA: El
50% de los alumnos gasta en su pasaje a la semana menos de $ 95.7085 pesos,
mientras que el otro 50% gasta más de $ 95.7085 pesos.
c)
Finalmente procedemos a graficar el histograma y de esta manera representar
nuestros datos de manera agrupada (en intervalos) y sus respectivas Frecuencia
Absoluta
En la clase de Estadística, hoy pude resolver
algunas dudas que tenía respecto al cálculo de las Medidas de Tendencia Central
para datos agrupados.
Primero, en la realización de los intervalos o clases para una base de datos, aprendí que a las constantes SIEMPRE se les debe sumar 1, ya sea que se trate de un número decimal o un número entero. Sabemos que si es decimal, por lo general se represen
ta con 4 decimales después del punto,
por ejemplo: 3.2987, entonces a éste únicamente le sumamos 1 al último número y
quedaría así: 3.2988. Sin embargo, la confusión puede originarse cuando nos
encontramos con un número entero, por ejemplo: 3, ya que este no tiene
decimales y pensaríamos que si le sumamos 1, entonces quedaría como 4, pero
esto sería erróneo. En el caso de los números enteros, para poder sumarle 1
tendríamos dos opciones:
(Suponiendo que es un 3)
1) Colocar el número, después el punto, luego tres ceros y al último un 1. Lo cual se representa como sigue: 3.0001
2) O bien, podemos colocar el número, después el punto y luego un 1. Lo cual quedaría representado así: 3.1
Segundo, para calcular la Mediana para datos agrupados aprendí que puede haber ocasiones en que los intervalos que obtengamos sean 2, y por consiguiente sean 2 las marcas de clase. Esto se debe principalmente que al momento de buscar las posiciones centrales de nuestra base de datos, éstas se encuentren en dos Fa acumuladas, por ejemplo:
Tenemos una muestra o base de datos con 250 valores, para saber las posiciones centrales que habremos de buscar en la columna de la Fa acumulada procedemos a dividir 250 entre 2 (n/2), cuyo resultado sería 125, sin embargo como la muestra es número par no sólo usaríamos la posición 125° sino que también la 126°. Entonces en la Fa acumulada buscaríamos el número donde 125 y 126 “entren”. Supongamos que en dicha Fa acumulada, tenemos los siguientes valores, con sus respectivos intervalos:
INTERVALOS................... FA ACUMULADA
(1.13-1.1678]..................2
(1.1678-1.2056]..............34
(1.2056-1.2434]..............57
(1.2434-1.2812]..............89
(1.2812-1.3190]..............125
(1.3190-1.3568]..............184
(1.3568-1.3946]..............211
(1.3946-1.4324]..............246
(1.4324-1.4702]..............250
Como vemos en la Fa acumulada tenemos un 125 cuyo intervalo es (1.2812-1.3190], el punto aquí es que el 126 ya no entra ahí, sino en el valor debajo de 125, que es 184, y cuyo intervalo es (1.3190-1.3568].
Entonces cuando se nos presentan este tipo de ocasiones, nuestra Mediana deberá representarse con los dos intervalos, así:
Me = (1.2812-1.3190], (1.3190-1.3568].
El problema sería al momento de darle su interpretación, pues tendríamos 2 marcas de clase. Cuando esto ocurra lo que debemos hacer para tener 1 sola marca de clase, es sumar el primer valor del primer intervalo más el segundo valor del segundo intervalo y dividirlo entre 2, lo que quedaría como:
1.2812+1.3568/2 = 1.3190
De tal modo a partir de dicho resultado, nuestra interpretación quedaría como, por ejemplo:
Mediana: “El 50% de los alumnos encuestados tienen una estatura inferior a 1.3190 metros, el otro 50% de los alumnos tienen una estatura superior a 1.3190 metros.”
Tercero, lo que también aprendí fueron algunas definiciones para las Medidas de Tendencia Central para datos agrupados, las cuales fueron dadas por el equipo expositor, así las definieron:
MEDIA: se refiere cuando los datos que se presentan en una distribución de frecuencias caen dentro de un intervalo de clase.
MEDIANA: es el conjunto de números
ordenados en magnitud.
MODA O CLASE MODAL: es el valor que se presenta con mayor frecuencia (que se repite más veces).
MODA O CLASE MODAL: es el valor que se presenta con mayor frecuencia (que se repite más veces).
Asimismo definieron:
HISTOGRAMA: se refiere al conjunto de rectángulos que tienen sus bases en el eje X (horizontal), y en cuyos centros están las marcas de clase para formar la línea poligonal.
No hay comentarios:
Publicar un comentario