Estadística Descriptiva UPN 153

miércoles, 5 de diciembre de 2012

Tema 3: Medidas de tendencia central para datos agrupados

MEDIDAS DE TENDENCIAL CENTRAL PARA DATOS AGRUPADOS

Evidencia 6 (21-Septiembre)

En la clase de este día (como en algunas de las anteriores) reafirme conocimientos sobre Medidas de Tendencia Central. Asimismo, he notado que mi aprendizaje se ha hecho más significativo a partir de la conformación por equipos, es de este modo que la retroalimentación de los conocimientos es mayor al momento en que cada uno de los integrantes de nuestro equipo participa, al mismo tiempo que hacemos del trabajo colaborativo algo mucho más ameno, y de cierta forma, divertido.

Por otra parte, hoy aprendí cómo elaborar una tabla que nos permite agrupar los datos; ésta se emplea generalmente cuando las variables toman un numero grande de valores, o bien, cuando se trata de variables continuas. Entonces, para proceder a agrupar los valores debemos usar los intervalos los cuales deben tener una “amplitud” semejante, a dicha amplitud se le conoce como clase, por esta razón decimos que se trata de INTERVALOS DE CLASE.

Los intervalos que hemos de utilizar para agrupar han de determinarse por el número de datos que tengamos en nuestra base (de datos). En otras palabras, de acuerdo al número de datos que tengamos, serán los intervalos que realicemos.

Ahora bien, para obtener los intervalos correspondientes a nuestros valores debemos:

1) Identificar el valor menor y el mayor (dato) de nuestra base de datos.

2) Una vez identificados hay que hacer una RESTA; al valor mayor le restaremos el valor menor.

3) De la resta obtendremos un número, el cual se debe DIVIDIR con el total de intervalos que vayamos a hacer; el resultado de dicha división lo llamaremos “constante”. Asimismo, el número que hayamos obtenido (constante) debe contar con 4 decimales después del punto, de tal manera, al último decimal le hemos de aumentar 1.

4) Después procederemos a SUMAR la constante más el valor menor de nuestra base de datos; así obtendremos nuestro primer intervalo, el cual ha de representarse como (LÍMITE 1– LÍMITE 2). Para el segundo intervalo, hemos de SUMAR el segundo límite del primer intervalo (el cual se convertirá en limite 1), más la constante lo cual nos determinará el límite 2 del segundo intervalo. En resumen, el límite 2 siempre se va a “bajar” tomando el lugar del límite 1, y el límite 2 del nuevo intervalo se obtendrá una vez que sumemos el límite 1 más la constante.

Para comprender mejor los pasos anteriores, veamos el ejemplo:

Tenemos una base de datos con los siguientes valores:

18.41, 18.36, 18. 29, 18. 41, 18.31, 18.24, 18.22, 18.27, 18.29, 18.38, 18.44, 18.40, 18.57, 18.22, 18.26, 18.23, 18.34, 18.20, 18.43, 18.35, 18.42, 18.36, 18.21, 18.33, 18.44, 18.40

1) El valor menor es 18.20; el valor mayor es 18.57.

2) 18.57 – 18.20 = 0.37

3) 0.37/6 = 0.0616 (al último decimal de agregamos +1) = 0.0617 (este número es nuestra constante)

4) 18.20 + 0.0617 = 18.2617

Nuestro primer intervalo se representará: 18.20 – 18.2617

Para el segundo intervalo sumaremos 18.2617 + 0.0617 = 18.3234 (el resultado será nuestro límite 2); entonces este intervalo se representará: 18.2617 – 18.3234

Así, realizando las correspondientes sumas, nuestros 6 intervalos serán:

18.20 – 18.2617

18.2617 - 18.3234

18.3234 – 18.3851

18.3851 – 18.4468

18.4468 – 18.5085

18.5085 – 18.5702

Una vez obtenidos todos los intervalos, debemos determinar cuántos valores de nuestra base de datos hay para cada intervalo, esto lo llamaremos como Frecuencia Absoluta para datos agrupados. Si en esta FA para datos agrupados tenemos como resultado el total de valores de nuestra base de datos, diremos que habremos posicionado bien a dichos valores según su intervalo.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Evidencia 8 (28-Septiembre)

El día de hoy en la clase de Estadística, aprendí varias cosas. Lo más importante para mí, fue saber cómo obtener las Medidas de Tendencia Central para datos agrupados; esto tiene una estrecha relación con lo que habíamos revisado en la clase de la semana pasada, aquella donde aprendimos a determinar los intervalos o las clases para agrupar datos.

De tal modo las MTC para datos agrupados siguen siendo la Media, Mediana y Moda. Primero, aprendí que para obtener la MEDIA debemos hacer un procedimiento o seguir una serie de pasos muy sencillos:

1) De nuestra base de datos; después de que ya obtuvimos los intervalos, y con éstos la Frecuencia Absoluta, la Frecuencia Relativa con sus respectivas representaciones (decimal y porcentaje) y la Frecuencia Absoluta acumulada; debemos sacar la MARCA DE CLASE de cada intervalo, la cual se determina SUMANDO los dos valores de nuestro intervalo y después dividiendo el resultado entre 2, así se realiza para cada intervalo que tengamos.

Un tip importante para rectificar si nuestras marcas de clase son correctas: podemos sumar por separado cada marca de clase más la constante que hayamos obtenido en el momento en que hayamos determinado nuestros intervalos.

2) Posteriormente, cada marca de clase se MULTIPLICARA por su respectiva FA. (Mc*Fi).

3) Los resultados de cada multiplicación (Mc*Fi) se SUMARAN.

4) Después de que hemos hecho la sumatoria de (Mc*Fi), ésta la vamos a DIVIDIR entre el número total de datos (NO de intervalos). Y ese resultado será nuestra media para datos agrupados.

Segundo, también aprendí cómo determinar la CLASE MODAL (moda). Esta resulta muy fácil de obtener ya que sólo debemos regresar a la tabla de frecuencias, ahí en la columna de la FA veremos que dato tiene mayor frecuencia. Así, la CLASE MODAL será nuestro INTERVALO (NO la frecuencia que tenga éste).

Tercero, aprendí cómo sacar la MEDIANA; para determinarla únicamente debemos:

1) Dividir el número total de datos entre 2, para saber cuál es la mitad de nuestra base de datos.

2) Recordemos que cuando nuestra base de datos es PAR la mediana siempre serán 2 números. Por ejemplo, si el total de la muestra (datos) es 250, éste lo dividimos entre 2 que es igual a 125; como nuestra base de datos es par, entonces utilizaremos 2 valores centrales que serían el 125 y 126.

3) Así, una vez que sabemos los valores de nuestra base de datos cuyas posiciones se encuentran a la mitad de ésta, nos remitiremos a ver la columna de la FA ACUMULADA, en esta columna buscaremos el valor donde puedan “entrar” nuestras posiciones centrales que en este caso son el 125 y 126. Por ejemplo supongamos que nuestra FA Acumulada tiene los siguientes valores: 2, 13, 47, 101, 145, 200, 233, 247, 250. Entonces el valor donde “entran” las posiciones centrales (125 y 126) es en el 145. Una vez visto que es en el 145 donde corresponden los valores centrales, nos remitiremos a ver el intervalo del 145. En este caso dicho intervalo será nuestra mediana.

Así, podemos que decir que una de las funciones de la FA acumulada es que sirve para obtener la MEDIANA para datos agrupados.

Por último, aprendí algunas modificaciones de las interpretaciones de las Medidas de Tendencia Central para datos agrupados. La MEDIA, sigue interpretándose igual como habíamos revisado en clases anteriores, por ejemplo: “si todos los alumnos de tercer año que fueron encuestados tuvieran la misma estatura, sería de 1.3019 metros (este valor fue el resultado de la sumatoria de las FA de cada marca de clase dividida entre el número total de datos).

La CLASE MODAL (moda) también se interpreta como lo hemos visto en clases anteriores, sólo que para datos agrupados utilizamos en intervalo para interpretar la frecuencia con que más se repiten los datos. Por ejemplo: “la mayoría de los alumnos de tercer año que fueron encuestados tienen una estatura entre 1.3190-1.3568 metros.”

Finalmente la interpretación de la MEDIANA, para mí, es la que cambia un poco. Pues para dicha interpretación hemos de usar la marca de clase del intervalo que haya sido nuestra mediana. Por ejemplo, si nuestro intervalo fue 1.2812-1.3190, y nuestra marca de clase fue 1.3001, entonces nuestra interpretación sería: “el 50 % de los alumnos tiene una estatura inferior a 1.3001 metros y el otro 50 % tiene una estatura superior a 1.3001 metros.

NOTA: cuando obtengamos como mediana 2 intervalos, para determinar el valor como marca de clase, tendremos que sumar el límite (izquierdo) del primer intervalo obtenido como mediana, más el límite (derecho) del otro intervalo. El resultado de esta suma será el valor central que nos permita dividir la base de datos y hacer nuestra interpretación.

Por último, en esta clase aprendí cómo graficar un HISTOGRAMA, el cual se utiliza precisamente sólo para datos agrupados, y cuya característica principal es que no hay espacio entre cada barra, y en cada una de éstas tenemos una marca de clase, las cuales uniéndolas nos permiten obtener una línea poligonal

Evidencia 9 (3-Octubre)

El día de hoy al realizar dos ejercicios semejantes a los que habíamos visto la clase anterior, únicamente reafirme mis conocimientos acerca de cómo determinar intervalos y obtener las Medidas de Tendencial Central para datos agrupados. Así con los conocimientos que ya adquirí y que he reafirmado, puedo explicar el siguiente ejercicio, a manera de ejemplo:

“En el grupo 32 de la Universidad Pedagógica Nacional 153 Ecatepec se desea saber la cantidad de dinero que gastan los alumnos en pasaje a la semana, para ello se aplicó una encuesta y se obtuvieron los siguientes resultados:

$ 130.00 $ 89.50 $ 85.50 $ 60.50

$ 145.00 $ 46.00 $ 118.00 $ 54.00

$ 35.50 $ 40.00 $ 45.50 $ 180.00

$ 96.00 $ 55.50 $ 64.00 $ 115.50

$ 45.50 $ 145.00 $ 133.50 $ 118.00

$ 145.00 $ 76.50 $ 75.00 $ 118.00

$ 118.00 $ 40.00 $ 57.50 $ 96.00

$ 63.50 $ 71.50 $ 96.00 $ 70.00

$ 112.00 $ 93.00 $ 118.00 $ 93.00

$ 57.50 $ 112.00 $ 45.50 $ 118.00

a) Determinar los intervalos y realizar una tabla de frecuencias con la FA, FR (con sus respectivas representaciones: decimal y porcentaje) y Fa acumulada.

b) Obtener las Medidas de Tendencia Central e interpretarlas.

c) Graficar un histograma para representar los intervalos y su FA.”

a) Para determinar el intervalo procedemos a encontrar el menor y el mayor valor dentro de nuestra base de datos, los restamos, dividimos entre el número de intervalos a realizar, y el resultado será nuestra constante.

180.00 – 35.50 = 144.5/6 = 24.0833 = 24.0834

Para obtener el primer intervalo sumamos el valor menor más la constante, para los demás intervalos sumaremos el valor del intervalo anterior más la constante y así sucesivamente.

Intervalos

35.50-59.5834

59.5834-83.6668

83.6668-107.7502

107.7502-131.8336

131.8336-155.9170

155.9170-180.0004

De los intervalos anteriores determinaremos su FA y Fa acumulada, así como las Marcas de clase (Mc, la cual es el resultado de la suma de los dos valores de cada intervalo dividido entre 2) y la Mc*Fi (que resulta de la multiplicación de Mc por FA). (Véase figura 12). Tanto Mc como Mc*Fi nos permitirán obtener la Media de nuestra base de datos.

b) Así una vez conocidos los resultados de Mc*Fi, procederemos a sumar cada uno de dichos resultados y él numero que resulte se dividirá entre el número total de datos. Entonces, la MEDIA es:

Ẋ = 3635.673/40 = 90.8918

Ahora bien, la siguiente Medida de Tendencia Central a obtener es la CLASE MODAL. Para ello basta con observar dentro de nuestra tabla cuál es el intervalo que tiene mayor FA, entonces nuestra CLASE MODAL es:

Mo = 35.50-59.5834

Por otro lado, es turno de determinar la MEDIANA. Entonces debemos saber si nuestra base de datos es par o impar. En nuestro ejemplo es PAR, esto quiere decir que la mediana serán 2 números que estén en las posiciones centrales.

40/2 = 20° y 21°

Así, la mediana estará en las posiciones 20° y 21° de nuestra base de datos, para saber el intervalo debemos observar nuestra tabla en la columna de Fa, y buscar en qué valor de esa columna “caben” el 20 y 21. De tal modo diremos que es en la tercera fila (25), entonces nuestra MEDIANA es:

Me = 83.6668-107.7502

Una vez que conocemos las Medidas de Tendencia Central hacemos las interpretaciones:

MEDIA: Si todos los alumnos encuestados gastarán la misma cantidad de dinero en su pasaje a la semana, sería de $ 90.8918 pesos.

CLASE MODAL: La mayoría de los alumnos del grupo 32 de la UPN 153 Ecatepec gastan en su pasaje a la semana entre $ 35.50 y $ 59.5834 pesos.

MEDIANA: El 50% de los alumnos gasta en su pasaje a la semana menos de $ 95.7085 pesos, mientras que el otro 50% gasta más de $ 95.7085 pesos.

c) Finalmente procedemos a graficar el histograma y de esta manera representar nuestros datos de manera agrupada (en intervalos) y sus respectivas Frecuencia Absoluta

En la clase de Estadística, hoy pude resolver algunas dudas que tenía respecto al cálculo de las Medidas de Tendencia Central para datos agrupados.

Primero, en la realización de los intervalos o clases para una base de datos, aprendí que a las constantes SIEMPRE se les debe sumar 1, ya sea que se trate de un número decimal o un número entero. Sabemos que si es decimal, por lo general se represen

ta con 4 decimales después del punto, por ejemplo: 3.2987, entonces a éste únicamente le sumamos 1 al último número y quedaría así: 3.2988. Sin embargo, la confusión puede originarse cuando nos encontramos con un número entero, por ejemplo: 3, ya que este no tiene decimales y pensaríamos que si le sumamos 1, entonces quedaría como 4, pero esto sería erróneo. En el caso de los números enteros, para poder sumarle 1 tendríamos dos opciones:

(Suponiendo que es un 3)

1) Colocar el número, después el punto, luego tres ceros y al último un 1. Lo cual se representa como sigue: 3.0001

2) O bien, podemos colocar el número, después el punto y luego un 1. Lo cual quedaría representado así: 3.1

Segundo, para calcular la Mediana para datos agrupados aprendí que puede haber ocasiones en que los intervalos que obtengamos sean 2, y por consiguiente sean 2 las marcas de clase. Esto se debe principalmente que al momento de buscar las posiciones centrales de nuestra base de datos, éstas se encuentren en dos Fa acumuladas, por ejemplo:

Tenemos una muestra o base de datos con 250 valores, para saber las posiciones centrales que habremos de buscar en la columna de la Fa acumulada procedemos a dividir 250 entre 2 (n/2), cuyo resultado sería 125, sin embargo como la muestra es número par no sólo usaríamos la posición 125° sino que también la 126°. Entonces en la Fa acumulada buscaríamos el número donde 125 y 126 “entren”. Supongamos que en dicha Fa acumulada, tenemos los siguientes valores, con sus respectivos intervalos:

INTERVALOS................... FA ACUMULADA

(1.13-1.1678]..................2
(1.1678-1.2056]..............34
(1.2056-1.2434]..............57
(1.2434-1.2812]..............89
(1.2812-1.3190]..............125
(1.3190-1.3568]..............184
(1.3568-1.3946]..............211
(1.3946-1.4324]..............246
(1.4324-1.4702]..............250

Como vemos en la Fa acumulada tenemos un 125 cuyo intervalo es (1.2812-1.3190], el punto aquí es que el 126 ya no entra ahí, sino en el valor debajo de 125, que es 184, y cuyo intervalo es (1.3190-1.3568].

Entonces cuando se nos presentan este tipo de ocasiones, nuestra Mediana deberá representarse con los dos intervalos, así:

Me = (1.2812-1.3190], (1.3190-1.3568].

El problema sería al momento de darle su interpretación, pues tendríamos 2 marcas de clase. Cuando esto ocurra lo que debemos hacer para tener 1 sola marca de clase, es sumar el primer valor del primer intervalo más el segundo valor del segundo intervalo y dividirlo entre 2, lo que quedaría como:

1.2812+1.3568/2 = 1.3190

De tal modo a partir de dicho resultado, nuestra interpretación quedaría como, por ejemplo:
Mediana: “El 50% de los alumnos encuestados tienen una estatura inferior a 1.3190 metros, el otro 50% de los alumnos tienen una estatura superior a 1.3190 metros.”

Tercero, lo que también aprendí fueron algunas definiciones para las Medidas de Tendencia Central para datos agrupados, las cuales fueron dadas por el equipo expositor, así las definieron:

MEDIA: se refiere cuando los datos que se presentan en una distribución de frecuencias caen dentro de un intervalo de clase.

MEDIANA: es el conjunto de números ordenados en magnitud.
MODA O CLASE MODAL: es el valor que se presenta con mayor frecuencia (que se repite más veces).

Asimismo definieron:

HISTOGRAMA: se refiere al conjunto de rectángulos que tienen sus bases en el eje X (horizontal), y en cuyos centros están las marcas de clase para formar la línea poligonal.

Tema 2: Medidas de tendencia central - Portafolio de evidencias

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Evidencia 4 (14-Septiembre)

En la clase de Estadística del día de hoy me divertí, aprendí y reafirmé varios conocimientos anteriores.

Lo primero que reafirme fue el concepto de algoritmo, éste se define como un procedimiento (o pasos a seguir) mediante el cual podemos obtener un resultado de cualquier operación matemática (como suma, resta, multiplicación, división, raíz cuadrada, entre otras.)

Así, un ejemplo de algoritmo fue el que nos enseñó el profesor Omar. Este algoritmo es muy sencillo y práctico, ya que nos permite realizar operaciones de multiplicación sin necesidad de sabernos de memoria las tablas de multiplicar; el procedimiento consiste en determinar el resultado con tan sólo utilizar líneas perpendiculares, el número de líneas que coloquemos dependerá de la multiplicación que vayamos a realizar. La clave de este procedimiento es usar diferentes colores al dibujar las líneas tanto para las unidades, como para las decenas, centenas, etc.; el resultado será igual al número de intersecciones que tengamos de dichas líneas.

Para mí este tipo de algoritmos, son una técnica muy eficaz que podríamos implementar como futuros docentes (sí decidimos laboral en esa área) para enseñarles a los alumnos las operaciones en matemáticas, con la finalidad de evitar que se confundan y aborrezcan dicha asignatura.

Por otra parte, después de hacer la recolección de datos (sobre el tiempo en correr de un extremo a otro en la cancha de futbol) por equipos y posteriormente de manera grupal, fortalecí los conocimientos sobre las medidas de tendencia central que ya poseía. Asimismo, aprendí a realizar la interpretación sobre los resultados que podamos obtener de la media, la mediana y la moda; un ejemplo de interpretación podría ser:

Base de datos

Variable: ¿cuántas horas a la semana dedican al estudio los alumnos del equipo 3 de Estadística del grupo 32 de la UPN 153 Ecatepec?

Michelle-- 21
Valeria-- 17
Anzaldo-- 12
Alan-- 9
Erika – 18

Ẋ= 21 + 17 + 12 + 9 + 18 / 5 = 77 / 5 = 15.4 horas a la semana

Me= 9, 12, 17, 18, 21

Me= 17

Mo= No hay

• Interpretación de las medidas de tendencia central

Media: si los valores se reparten de manera equitativa, podemos decir que las horas de estudio a la semana que dedican los alumnos del equipo 3 de Estadística de la UPN 153 Ecatepec, equivalen a 15.4 horas en promedio.

Mediana: el 50% de los datos quieren decir que el tiempo invertido en el estudio oscila entre 9 y 17 horas semanales. Asimismo, el otro 50% de los datos explican que el tiempo invertido en el estudio oscila entre 17 y 21 horas a la semana.

Moda: en esta base de datos no existe moda, ya que no hay ningún número que tenga mayor frecuencia que los demás.

Finalmente, además de aprender la interpretación de las medidas de tendencia central, aprendí un punto muy importante de éstas y se refiere al momento de realizar la gráfica correspondiente a la FA, mediante la cual podemos determinar qué tipo de distribución tienen los valores o datos. Así, cuando partimos por la mitad la barra central de la gráfica y de cada lado hay la misma proporción de barras, diremos que tenemos una “distribución normal.” De la misma manera, es mucho más fácil saber si una base de datos tiene una distribución normal, cuando las tres medidas de tendencia central coinciden, es decir, su resultado es el mismo. (Para que se entienda mejor véase la Figura 3, tabla y gráfica de barras).

Evidencia 5 (19-Septiembre)

En la clase de Estadística Descriptiva en Educación del día de hoy aprendí a realizar un procedimiento muy sencillo para adivinar el número que otra persona haya pensado, el cual consistía en llevar a cabo operaciones matemáticas básicas como multiplicación, suma, división y resta. Asimismo, aprendí la manera cómo un docente puede aplicar estrategias para lograr que sus alumnos aprendan las matemáticas, incluso el ejemplo que nos dio el profesor Omar es la forma cómo se pueden realizar operaciones algebraicas sólo que en este caso en lugar de usar números, signos o símbolos, utilizamos peras y manzanas. Nuevamente vemos que existen muchos algoritmos que nos permiten aprender y posteriormente enseñar cosas que pueden parecer muy complicadas, no obstante cuando conocemos cómo aplicar dichos procedimientos nuestro aprendizaje y posteriormente nuestra enseñanza probablemente sean más significativos.

Por otro lado, en relación a la Estadística, reafirme conocimientos acerca de las Medidas de Tendencia Central y el uso de las Variables de estudio. Entendí completamente que, de acuerdo a las variables que se tomen en cuenta para la recolección de datos es que podremos obtener la Media, Mediana y Moda; esto quiere decir que no en todas las variables de estudio es posible determinar las Medidas de Tendencia. Por ejemplo, cuando tenemos por variable de estudio el “sexo” no podemos obtener mediana ni media. En el primer caso, la mediana no se obtiene porque los resultados (que serían Femenino y Masculino) no se pueden ordenar, ya que se considera como una variable categórica nominal, y por consiguiente no tenemos un valor central. En el segundo caso, no tenemos números en esta variable es así que es imposible sumar y dividir los datos para obtener el promedio o la media.

Entonces, se determina cuando es posible obtener las Medidas de Tendencia Central de acuerdo a las variables de estudio: las variables que nos permiten obtener la MEDIA son las numéricas continuas y discretas; las que nos permiten obtener la MEDIANA son las numéricas continuas y discretas, y las categóricas ordinales; finalmente las que nos permiten obtener la MODA son las numéricas continuas y discretas, y las categóricas nominales y ordinales.

Finalmente aprendí algunas de las desventajas de las MTC, por ejemplo:

MODA: una de sus desventajas es que cuando tenemos muchas modas deja de ser relevante el resultado ya que no es un valor que nos especifique de forma rotunda la frecuencia con que se repiten los datos.

MEDIANA: su desventaja es que no se puede aplicar en las variables categóricas nominales (como ya se mencionó anteriormente).

MEDIA: una de sus desventajas es que deja de ser relevante o tener sentido al momento que se hace una repetición equitativa, esto aplica sobre todo en los casos en que los valores no son uniformes debido a que nuestra base de datos sea muy extensa, es así que el promedio puede distar mucho de la realidad, como es el caso sobre el ingreso mensual de las familias mexicanas que nos explicaba el profesor.

Tema 1: CONCEPTOS BÁSICOS DE ESTADÍSTICA

CONCEPTOS BÁSICOS DE ESTADÍSTICA: VARIABLES, FRECUENCIAS…

Evidencia 1 (31-Agosto)

Después de dos clases de “Estadística Descriptiva en Educación” he logrado aprender y reafirmar conocimientos en relación a esta materia, por ejemplo: algunos conceptos básicos como son las variables (que son las características de una población o muestra que pueden ser medidas o comparadas). Así, después de una recopilación de datos grupales, logré comprender lo qué es la frecuencia absoluta y la frecuencia relativa; la primera se refiere al numero de veces que se repite un valor (tal y como sucede con la moda); la segunda también se refiere al número de veces que se repite un valor, pero con respecto al total de datos. Lo anterior se puede ejemplificar de la siguiente manera:

Total de personas encuestadas (total de datos): 27

Edades - Frecuencia absoluta (FA) - Frecuencia relativa (FR)

18 - 5 - 5/27

19 - 9 - 9/27

20 - 7 - 7/27

21 - 4 - 4/27

22 - 2 - 2/27

Como se puede observar, las edades son la variable a estudiar, además se puede ver que los valores tanto de la FA como de la FR son parecidos, lo único que cambia es que la FR se expresa a manera de “fracción” y esto es a causa del total de datos o personas encuestadas, como se menciona en la definición del primer párrafo.

Asimismo, de la clase aprendí algo totalmente nuevo, que es en relación al uso de las graficas para la representación de datos. Ahora sé que la gráfica de barras se utiliza para representar la Frecuencia Absoluta (FA), algunas de sus características son que las barras son pueden ir juntas (porque si no pasaría a ser histograma), además que cuando en el eje horizontal no se inicia colocando los datos desde “cero” (0), se deben colocar dos barras diagonales (//) que intersecten el eje. Por otro lado, ahora sé que el gráfico circular se usa para la Frecuencia Relativa (FR), en donde se utilizan los porcentajes para representar los datos obtenidos.

Sin embargo, la FR en algunos casos también puede ser representada con gráfica de barras, e incluso se hace de manera similar que la FA, la única diferencia es la graduación del eje vertical de la FR, ya que éste se gradúa a manera de fracción.

De igual modo, el día de hoy aprendí que se puede representar de varias maneras la FR, esto puede ser en decimales o en porcentaje. Los decimales resultan de la división entre el numerador y denominador de cada dato de la FR; y el porcentaje resulta simplemente de multiplicar los decimales por 100. Por ejemplo, retomando los datos presentados anteriormente:

Edades - FR - Decimales - Porcentaje

18 - 3/27 - 0.1111 - 11.11 %

19 - 9/27 - 0.3333 - 33.33 %

20 - 7/27 - 0.2592 - 25.92 %

21 - 4/27 - 0.1481 - 14.81 %

22 - 2/27 - 0.0740 - 7.4 %

Finalmente, aprendí que para verificar los resultados obtenidos en cada columna (en FA y FR) respecto al total de datos, se realiza una sumatoria (∑), y asimismo, para saber el total de resultados (en los decimales y porcentajes) se realiza la misma operación (∑), y de tal modo habremos hecho un recuento, análisis e interpretación de datos obtenido resultados confiables, esto es precisamente la tarea que lleva a cabo la estadística.

Evidencia 2 (5-Septiembre)

El día de hoy, al continuar con el tema de las variables aprendí su clasificación, lo que me pareció un aspecto muy importante que debemos saber al momento de llevar a cabo investigaciones, para que de tal modo, los resultados que se consigan sean mucho más concisos.

Así, las variables se clasifican dependiendo del tipo de respuesta que se obtiene:

1) VARIABLES NUMÉRICAS: que como su nombre lo dice son aquellas que tienen NÚMEROS.

Por un lado, éstas se dividen en VARIABLES NUMÉRICAS CONTINUAS, que son las que poseen números decimales. Por ejemplo, la estatura, la distancia que recorre un automóvil durante 1 hora, el promedio final de un alumno, etc.

Por otro lado, éstas también se dividen den VARIABLES NUMÉRICAS DISCRETAS, que aquellas que tienen números enteros. Por ejemplo, el número de hermanos o hijos que tiene una persona, la edad, etc.

2) VARIABLES CATEGÓRICAS: a diferencia de las variables numéricas, éstas tienen PALABRAS.

Por una parte, están las VARIABLES CATEGÓRICAS ORDINALES, que como su nombre lo dice se pueden ordenar por jerarquías. Por ejemplo, el nivel de estudios de una persona o la posición que se ocupa entre los hermanos.

Por otra parte, tenemos a las VARIABLES CATEGÓRICAS NOMINALES, que a diferencia de las anteriores no se ordenan; bueno si se pueden llegar a ordenar pero bajo criterios de cada persona, es decir se ordenan de manera subjetiva. Por ejemplo, el sexo, las expectativas que se tienen de una clase, la religión, entre otras.

Finalmente, también aprendí que algunas variables pueden ser ambiguas, esto quiere decir que se van a clasificar de acuerdo al criterio del investigador, de esta manera, algunas variables pueden ser consideradas como numéricas continuas y numéricas discretas. Un ejemplo de lo anterior es el tiempo, que puede representarse ya sea en enteros y/o decimales. Asimismo, esto sucede con las variables categóricas, donde algunas se consideran tanto categóricas ordinales y nominales, ya que su clasificación también depende de la subjetividad del investigador.

Evidencia 3 (12-Septiembre)

En la clase de hoy, además de reafirmar y retroalimentar algunos conceptos que ya hemos visto las clases anteriores (como qué es estadística, qué son las variables, tipos de variables, qué son las frecuencias absoluta y relativa, etc.), aprendí a qué se refiere la Frecuencia Absoluta Acumulada, la cual se define como la suma de frecuencias absolutas; asimismo aprendí lo qué es la Frecuencia Relativa Acumulada, la cual surge del resultado de la división de la FA acumulada entre el tamaño de la muestra.

Prácticamente no existe mucha diferencia entre las Frecuencias Absoluta y Relativa que vimos la semana pasada, y las Frecuencias Absoluta y Relativa Acumuladas que explicó el segundo equipo de exposición. (Para que se entienda mejor véase la figura 1, tabla). Así vemos que es muy sencillo calcular las Frecuencias Absoluta y Relativa Acumuladas.

Estadística Descriptiva UPN 153

miércoles, 5 de diciembre de 2012

Tema 3: Medidas de tendencia central para datos agrupados

Tema 2: Medidas de tendencia central - Portafolio de evidencias

Tema 1: CONCEPTOS BÁSICOS DE ESTADÍSTICA

Datos personales

Archivo del blog