miércoles, 5 de diciembre de 2012

Tema 3: Medidas de tendencia central para datos agrupados



MEDIDAS DE TENDENCIAL CENTRAL PARA DATOS AGRUPADOS

Evidencia 6 (21-Septiembre)
En la clase de este día (como en algunas de las anteriores) reafirme conocimientos sobre Medidas de Tendencia Central. Asimismo, he notado  que mi aprendizaje se ha hecho más significativo a partir de la conformación por equipos, es de este modo que la retroalimentación de los conocimientos  es mayor al momento en que cada uno de los integrantes de nuestro equipo participa, al mismo tiempo que hacemos del trabajo colaborativo algo mucho más ameno, y de cierta forma, divertido.
Por otra parte, hoy aprendí cómo elaborar una tabla que nos permite agrupar los datos; ésta se emplea generalmente cuando las variables toman un numero grande de valores, o bien, cuando se trata de variables continuas. Entonces, para proceder a agrupar los valores debemos usar los intervalos los cuales deben tener una “amplitud” semejante, a dicha amplitud se le conoce como clase, por esta razón decimos que se trata de INTERVALOS DE CLASE. 
Los intervalos que hemos de utilizar para agrupar han de determinarse por el número de datos que tengamos en nuestra base (de datos). En otras palabras, de acuerdo al número de datos que tengamos, serán los intervalos que realicemos.
Ahora bien, para obtener los intervalos correspondientes a nuestros valores debemos:
1)    Identificar el valor menor y el mayor (dato) de nuestra base de datos.
2)    Una vez identificados hay que hacer una RESTA; al valor mayor le restaremos el valor menor.
3)    De la resta obtendremos un número, el cual se debe DIVIDIR con el total de intervalos que vayamos a hacer; el resultado de dicha división lo llamaremos “constante”. Asimismo, el número que hayamos obtenido (constante) debe contar con 4 decimales después del punto,  de tal manera, al último decimal  le hemos de aumentar  1.
4)     Después procederemos a SUMAR la constante más el valor menor de nuestra base de datos; así obtendremos nuestro primer intervalo, el cual ha de representarse como (LÍMITE  1– LÍMITE 2). Para el segundo intervalo, hemos de SUMAR el segundo límite del primer  intervalo (el cual se convertirá en limite 1), más la constante lo cual nos determinará el límite 2 del segundo intervalo. En resumen,  el límite 2 siempre se va a “bajar” tomando el lugar del límite 1, y el límite 2 del nuevo  intervalo se obtendrá una vez que sumemos el límite 1 más la constante.
Para comprender mejor los pasos anteriores, veamos el  ejemplo: 
Tenemos una base de datos con los siguientes valores:
18.41, 18.36, 18. 29, 18. 41, 18.31, 18.24, 18.22, 18.27, 18.29, 18.38, 18.44, 18.40, 18.57, 18.22, 18.26, 18.23, 18.34, 18.20, 18.43, 18.35, 18.42, 18.36, 18.21, 18.33, 18.44, 18.40
1)    El valor menor es 18.20; el valor mayor es 18.57.
2)    18.57 – 18.20 = 0.37
3)    0.37/6 = 0.0616 (al último decimal de agregamos +1) = 0.0617 (este número es nuestra constante)
4)    18.20 + 0.0617 = 18.2617
Nuestro primer intervalo se representará: 18.20 – 18.2617
Para el segundo intervalo sumaremos 18.2617 + 0.0617 = 18.3234 (el resultado será nuestro límite 2); entonces este intervalo se representará: 18.2617 – 18.3234
Así, realizando las correspondientes sumas,  nuestros 6  intervalos serán:

18.20 – 18.2617 
18.2617 - 18.3234
18.3234 – 18.3851
18.3851 – 18.4468
18.4468 – 18.5085
18.5085 – 18.5702

Una vez obtenidos todos los intervalos, debemos determinar cuántos valores de nuestra base de datos hay para cada intervalo, esto lo llamaremos como Frecuencia Absoluta para datos agrupados. Si en esta FA para datos agrupados tenemos como resultado el total de valores de nuestra base de datos, diremos que habremos posicionado bien a dichos valores según su intervalo.



MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Evidencia 8 (28-Septiembre)

El día de hoy en la clase de Estadística, aprendí varias cosas. Lo más importante para mí, fue saber cómo obtener las Medidas de Tendencia Central para datos agrupados; esto tiene una estrecha relación con lo que habíamos revisado en la clase de la semana pasada, aquella donde aprendimos a determinar los intervalos o las clases para agrupar datos.
De tal modo las MTC para datos agrupados siguen siendo la Media, Mediana y Moda. Primero, aprendí que para obtener la MEDIA  debemos hacer un procedimiento o seguir una serie de pasos muy sencillos:
1)    De nuestra base de datos; después de que ya obtuvimos los intervalos, y con éstos la Frecuencia Absoluta, la Frecuencia Relativa con sus respectivas representaciones (decimal y porcentaje) y la Frecuencia Absoluta acumulada; debemos sacar la MARCA DE CLASE de cada intervalo, la cual se determina SUMANDO los dos valores de nuestro intervalo y después dividiendo el resultado entre 2, así se realiza para cada intervalo que tengamos.

Un tip importante para rectificar si nuestras marcas de clase son correctas: podemos sumar por separado cada marca de clase más la constante que hayamos obtenido en el momento en que hayamos determinado nuestros intervalos.

2)    Posteriormente, cada marca de clase se MULTIPLICARA por su respectiva FA. (Mc*Fi).
3)    Los resultados de cada multiplicación (Mc*Fi) se SUMARAN.
4)    Después de que hemos hecho la sumatoria de (Mc*Fi), ésta la vamos a DIVIDIR entre el número total de datos (NO de intervalos). Y ese resultado será nuestra media para datos agrupados.
Segundo, también aprendí cómo determinar la CLASE MODAL (moda). Esta resulta muy fácil de obtener ya que sólo debemos regresar a la tabla de frecuencias, ahí en la columna de la FA veremos que dato tiene mayor frecuencia. Así, la CLASE MODAL será nuestro INTERVALO (NO la frecuencia que tenga éste).
Tercero, aprendí cómo sacar la MEDIANA; para determinarla únicamente debemos:
1)    Dividir el número total de datos entre 2, para saber cuál es la mitad de nuestra base de datos.
2)    Recordemos que cuando nuestra base de datos es PAR la mediana siempre serán 2 números. Por ejemplo, si el total de la muestra (datos) es 250, éste lo dividimos entre 2 que es igual a 125; como nuestra base de datos es par, entonces utilizaremos 2 valores centrales que serían el 125 y 126.
3)    Así, una vez que sabemos los valores de nuestra base de datos cuyas posiciones se encuentran a la mitad de ésta, nos remitiremos a ver la columna de la FA ACUMULADA, en esta columna buscaremos el valor donde puedan “entrar” nuestras posiciones centrales que en este caso son el 125 y 126. Por ejemplo supongamos que nuestra FA Acumulada tiene los siguientes valores: 2, 13, 47, 101, 145, 200, 233, 247, 250. Entonces el valor donde “entran” las posiciones centrales (125 y 126) es en el 145. Una vez visto que es en el 145 donde corresponden los valores centrales, nos remitiremos a ver el intervalo del 145. En este caso dicho intervalo será nuestra mediana.
Así, podemos que decir que una de las funciones de la FA acumulada es que sirve para obtener la MEDIANA para datos agrupados.

Por último, aprendí algunas modificaciones de las interpretaciones de las Medidas de Tendencia Central para datos agrupados. La MEDIA, sigue interpretándose igual como habíamos revisado en clases anteriores, por ejemplo: “si todos los alumnos de tercer año que fueron encuestados tuvieran la misma estatura, sería de 1.3019 metros (este valor fue el resultado de la sumatoria de las FA de cada marca de clase dividida entre el número total de datos).
La CLASE MODAL (moda) también se interpreta como lo hemos visto en clases anteriores, sólo que para datos agrupados utilizamos en intervalo para interpretar la frecuencia con que más se repiten los datos.  Por ejemplo: “la mayoría de los alumnos de tercer año que fueron encuestados tienen una estatura entre 1.3190-1.3568 metros.”
Finalmente la interpretación de la MEDIANA, para mí, es la que cambia un poco. Pues para dicha interpretación hemos de usar la marca de clase del intervalo que haya sido nuestra mediana. Por ejemplo, si nuestro intervalo fue 1.2812-1.3190, y nuestra marca de clase fue 1.3001, entonces nuestra interpretación sería: “el 50 % de los alumnos tiene una estatura inferior a 1.3001 metros y el otro 50 % tiene una estatura superior a 1.3001 metros.
NOTA: cuando obtengamos como mediana 2 intervalos, para determinar el valor como marca de clase, tendremos que sumar el límite (izquierdo) del primer intervalo obtenido como mediana,  más el límite (derecho) del otro intervalo. El resultado de esta suma será el valor central que nos permita dividir la base de datos y hacer nuestra interpretación.
Por último, en esta clase aprendí cómo graficar un HISTOGRAMA, el cual se utiliza precisamente sólo para datos  agrupados, y cuya característica principal es que no hay espacio entre cada barra, y  en cada una de éstas tenemos una marca de clase, las cuales uniéndolas nos permiten obtener una línea poligonal 


Evidencia 9 (3-Octubre)

El día de hoy al realizar  dos ejercicios semejantes a los que habíamos visto la clase anterior, únicamente reafirme mis conocimientos acerca de cómo determinar intervalos y obtener las Medidas de Tendencial  Central para datos agrupados.  Así con los conocimientos que ya adquirí y que he reafirmado, puedo explicar el siguiente ejercicio, a manera de ejemplo:
“En el grupo 32 de la Universidad Pedagógica Nacional 153 Ecatepec  se desea saber la cantidad de dinero que gastan los alumnos en pasaje a la semana, para ello se aplicó una encuesta y se obtuvieron los siguientes resultados:

$ 130.00               $ 89.50               $ 85.50               $ 60.50
$ 145.00               $ 46.00               $ 118.00             $ 54.00
$ 35.50                 $ 40.00               $ 45.50                $ 180.00
$ 96.00                 $ 55.50               $ 64.00                $ 115.50
$ 45.50                 $ 145.00             $ 133.50             $ 118.00
$ 145.00               $ 76.50               $ 75.00               $ 118.00
$ 118.00               $ 40.00              $ 57.50                $ 96.00
$ 63.50                 $ 71.50              $ 96.00                $ 70.00
$ 112.00               $ 93.00              $ 118.00             $ 93.00
$ 57.50                 $ 112.00            $ 45.50               $ 118.00
a)    Determinar los intervalos y realizar una tabla de frecuencias con la FA, FR (con sus respectivas representaciones: decimal y porcentaje) y Fa acumulada.
b)    Obtener las Medidas de Tendencia Central e interpretarlas.
c)    Graficar un histograma para representar los intervalos y su FA.”

a) Para determinar el intervalo procedemos a encontrar el menor y el mayor valor dentro de nuestra base de datos, los restamos, dividimos entre el número de intervalos a realizar, y el resultado será nuestra constante.
180.00 – 35.50 =  144.5/6 = 24.0833 = 24.0834
Para obtener el primer intervalo sumamos el valor menor más la constante, para los demás intervalos sumaremos el valor del intervalo anterior más la constante y así sucesivamente.

Intervalos
35.50-59.5834
59.5834-83.6668
83.6668-107.7502
107.7502-131.8336
131.8336-155.9170
155.9170-180.0004

De  los intervalos anteriores determinaremos su FA y Fa acumulada, así como las Marcas de clase (Mc, la cual es el resultado de la suma de los dos valores de cada intervalo dividido entre 2) y la Mc*Fi (que resulta de la multiplicación de Mc por FA). (Véase figura 12). Tanto Mc como Mc*Fi nos permitirán obtener la Media de nuestra base de datos.

b) Así una vez conocidos los resultados de Mc*Fi, procederemos a sumar cada uno de dichos resultados y él numero que resulte  se dividirá entre el número total de datos. Entonces,  la MEDIA es:
Ẋ = 3635.673/40 = 90.8918

Ahora bien, la siguiente Medida de Tendencia Central a obtener es la CLASE MODAL. Para ello basta con observar dentro de nuestra tabla cuál es el intervalo que tiene mayor FA, entonces nuestra CLASE MODAL es:
Mo = 35.50-59.5834
Por otro lado, es turno de determinar la MEDIANA. Entonces debemos saber si nuestra base de datos es par o impar. En nuestro ejemplo es PAR, esto quiere decir que la mediana serán 2 números que estén en las posiciones centrales.
40/2 = 20° y 21°
Así, la mediana estará en las posiciones 20° y 21° de nuestra base de datos, para saber el intervalo debemos observar nuestra tabla en la columna de Fa, y buscar en qué valor de esa columna “caben” el 20 y 21. De tal modo diremos que es en la tercera fila (25), entonces nuestra MEDIANA es:
Me = 83.6668-107.7502

Una vez que conocemos las Medidas de Tendencia Central hacemos las interpretaciones:

MEDIA: Si todos los alumnos encuestados gastarán la misma cantidad de dinero en su pasaje a la semana, sería de $ 90.8918 pesos.
CLASE MODAL: La mayoría de los alumnos del grupo 32 de la UPN 153 Ecatepec gastan en su pasaje a la semana entre $ 35.50 y $ 59.5834 pesos.
MEDIANA: El 50% de los alumnos gasta en su pasaje a la semana menos de $ 95.7085 pesos, mientras que el otro 50% gasta más de $ 95.7085 pesos.

c) Finalmente procedemos a graficar el histograma y de esta manera representar nuestros datos de manera agrupada (en intervalos) y sus respectivas Frecuencia Absoluta

En la clase de Estadística, hoy pude resolver algunas dudas que tenía respecto al cálculo de las Medidas de Tendencia Central para datos agrupados. 

Primero, en la realización de los intervalos o clases para una base de datos, aprendí que a las constantes SIEMPRE se les debe sumar 1, ya sea que se trate de un número decimal o un número entero. Sabemos que si es decimal, por lo general se represen
ta con 4 decimales después del punto, por ejemplo: 3.2987, entonces a éste únicamente le sumamos 1 al último número y quedaría así: 3.2988. Sin embargo, la confusión puede originarse cuando nos encontramos con un número entero, por ejemplo: 3, ya que este no tiene decimales y pensaríamos que si le sumamos 1, entonces quedaría como 4, pero esto sería erróneo. En el caso de los números enteros, para poder sumarle 1 tendríamos dos opciones:

(Suponiendo que es un 3)

1) Colocar el número, después el punto, luego tres ceros y al último un 1. Lo cual se representa como sigue: 3.0001

2) O bien, podemos colocar el número, después el punto y luego un 1. Lo cual quedaría representado así: 3.1

Segundo, para calcular la Mediana para datos agrupados aprendí que puede haber ocasiones en que los intervalos que obtengamos sean 2, y por consiguiente sean 2 las marcas de clase. Esto se debe principalmente que al momento de buscar las posiciones centrales de nuestra base de datos, éstas se encuentren en dos Fa acumuladas, por ejemplo: 

Tenemos una muestra o base de datos con 250 valores, para saber las posiciones centrales que habremos de buscar en la columna de la Fa acumulada procedemos a dividir 250 entre 2 (n/2), cuyo resultado sería 125, sin embargo como la muestra es número par no sólo usaríamos la posición 125° sino que también la 126°. Entonces en la Fa acumulada buscaríamos el número donde 125 y 126 “entren”. Supongamos que en dicha Fa acumulada, tenemos los siguientes valores, con sus respectivos intervalos:


INTERVALOS................... FA ACUMULADA

(1.13-1.1678]..................2
(1.1678-1.2056]..............34
(1.2056-1.2434]..............57
(1.2434-1.2812]..............89
(1.2812-1.3190]..............125
(1.3190-1.3568]..............184
(1.3568-1.3946]..............211
(1.3946-1.4324]..............246
(1.4324-1.4702]..............250

Como vemos en la Fa acumulada tenemos un 125 cuyo intervalo es (1.2812-1.3190], el punto aquí es que el 126 ya no entra ahí, sino en el valor debajo de 125, que es 184, y cuyo intervalo es (1.3190-1.3568].

Entonces cuando se nos presentan este tipo de ocasiones, nuestra Mediana deberá representarse con los dos intervalos, así:

Me = (1.2812-1.3190], (1.3190-1.3568].

El problema sería al momento de darle su interpretación, pues tendríamos 2 marcas de clase. Cuando esto ocurra lo que debemos hacer para tener 1 sola marca de clase, es sumar el primer valor del primer intervalo más el segundo valor del segundo intervalo y dividirlo entre 2, lo que quedaría como:

1.2812+1.3568/2 = 1.3190

De tal modo a partir de dicho resultado, nuestra interpretación quedaría como, por ejemplo:
Mediana: “El 50% de los alumnos encuestados tienen una estatura inferior a 1.3190 metros, el otro 50% de los alumnos tienen una estatura superior a 1.3190 metros.”

Tercero, lo que también aprendí fueron algunas definiciones para las Medidas de Tendencia Central para datos agrupados, las cuales fueron dadas por el equipo expositor, así las definieron:

MEDIA: se refiere cuando los datos que se presentan en una distribución de frecuencias caen dentro de un intervalo de clase.
MEDIANA: es el conjunto de números ordenados en magnitud.
MODA O CLASE MODAL: es el valor que se presenta con mayor frecuencia (que se repite más veces).

Asimismo definieron:

HISTOGRAMA: se refiere al conjunto de rectángulos que tienen sus bases en el eje X (horizontal), y en cuyos centros están las marcas de clase para formar la línea poligonal. 


No hay comentarios:

Publicar un comentario