miércoles, 5 de diciembre de 2012

Tema 5: Regla empírica y de chevichev



REGLA EMPÍRICA Y REGLA DE CHEBYSHEV

Evidencia 17 (07-Noviembre)

El día de hoy en la clase de Estadística, se realizaron ejercicios retomando los temas revisados previamente: Medidas de Tendencia Central y Medidas de Dispersión. A partir de la obtención de dichas medidas abordamos la regla empírica y la regla de Chebyshev. 

De tal modo, aprendí que estas reglas tienen como finalidad "complementar la mediana", es decir, permiten obtener resultados mucho más concisos. Recordemos que la mediana tiene como objetivo encontrar el dato que se encuentra justo a la mitad de la muestra, al mismo tiempo que divide en partes iguales a dicha colección de datos; así cuando decimos que la regla empírica y la de Chebyshev complementan a la mediana es porque ayudan a obtener resultados concretos a fin de conocer con mayor precisión cómo es que se están comportando los valores dentro de una base de datos. 

Asimismo, aprendí por un lado, que la regla empírica se aplica siempre y cuando tengamos una distribución normal de los valores en una muestra, esto es generalmente cuando al momento de representar obtengamos gráficas de forma acampanada.
Entonces, si la muestra cumple con esa condición, podremos aplicar 3 distintas fórmulas, éstas son de acuerdo al "resultado porcentual" que deseemos obtener; así, las fórmulas son las siguientes: 


1) (x-σ),(x+σ) --> obtenemos aproximadamente 68 % de la distribución.
2) (x-2σ),(x+2σ) --> aprox. 95%
3) (x-3σ),(x+3σ) --> aprox. 99 e incluso 100% 


Como podemos ver, el porcentaje aumenta de acuerdo al número de desviaciones estándar que ocupemos. 

Por otro lado aprendí cómo obtener la regla de Chebyshev, ésta se obtiene en los casos cuando no es posible determinar la regla empírica (cuando no hay una distribución normal de los datos). De tal modo, tenemos 2 fórmulas distintas para obtener dicha regla:

1) (x-Ks, x+Ks)--> donde K es cualquier valor superior a 1; y donde s es la desviación estándar. 
Así, para comprender mejor la regla de Chebyshev, consideremos el siguiente ejemplo:

"Supongamos que los resultados de la media y la desviación estándar de una base de datos son:

x= 106.4300
σ= 100.0936
Entonces sustituimos dichos valores en la fórmula: 

(106.4300-2(100.0936), 106.4300+2(100.0936)

=(106.4300-200.1872, 106.4300+200.1872)

=(-93.7573, 306.6172) 


Como vemos el resultado que obtenemos es a manera de un intervalo."

2) 1-1/K2(100%)

"Suponiendo que tenemos:

x= 106.4300

σ= 100.0936

Sustituimos en la fórmula: 

1-1/(2)2(100%) = 1- 1/4(100%)

=1-0.25(100%)= 0.75(100%)

= 75% 


Como observamos, el resultado se representa en porcentaje, asimismo el valor de K es cualquier valor, éste por el momento es determinado por el profesor."

Finalmente, puedo decir que tanto la regla empírica como la regla de Chebyshev ayudan a conocer más detalladamente cómo es que se está comportando la base de datos estudiada. Asimismo, vemos la importancia que tienen las MTC y las MDD, ya que ambas nos ayudan a determinar las reglas ya mencionadas. 

Evidencia18 (09-Noviembre)

El día de hoy en la clase de Estadística Descriptiva en Educación retomamos los temas ya revisados con anterioridad, así, se resolvieron ejercicios sobre Medidas de Tendencia Central y Medidas de Dispersión, incluyendo el último tema visto: la regla empírica y de Chebyshev.
 

Con respecto a este último tema, aprendí a realizar las interpretaciones correspondientes para cada regla; por una parte, sabemos que para la regla empírica usamos 3 fórmulas las cuales nos dan como resultado 3 porcentajes o resultados diferentes (éstos dependen de las desviaciones estándar utilizadas para su cálculo); cada resultado nos dice aproximadamente “qué porcentaje de los datos” cumplen con el intervalo que se haya obtenido, entonces con respecto a esto se realiza la interpretación. Por otra parte, pero con mucha relación a la anterior tenemos la interpretación para la regla de Chebyshev mediante la cual podemos saber “el porcentaje de los datos que cumplen con la característica del intervalo.” Sin duda, a pesar de que el procedimiento para obtener cada regla sea diferente, las interpretaciones son similares ya que ambas nos permiten saber con mayor precisión la distribución que está teniendo la muestra de datos analizada.

Para reafirmar estos conocimientos, tenemos el siguiente ejemplo explicado en una publicación previa, no obstante en esta ocasión se le agregará “cómo aplicar y resolver alguna de las dos reglas”, de tal modo lo que he aprendido se muestra a continuación:

Ejemplo:

“Las calificaciones de 8 alumnos de 5° de primaria en su primer examen de español, fueron las siguientes:
6.2, 9.7, 5.5, 8.2, 8.2, 8.9, 9.3, 7.5


a) Determinar las Medidas de Tendencia Central para datos agrupados y sus respectivas interpretaciones.

b) Obtener las Medidas de Dispersión y su interpretación.

c) Graficar el histograma.

d) Aplicar la regla empírica o de Chebyshev, según sea el caso e interpretar."


A) MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
MEDIA
9.7-5.5= 4.2/4= 1.05= 1.0501

Clase……………………..…FA………Fa………...Mc…….…..….Mc*Fi
(5.5-6.5501]………………2….……..2……….6.0250…………12.0500
(6.5501-7.6002]………..1…….…..3……….7.0751…………7.0751
(7.6002-8.6503]………..2…….…..5……….8.1252…………16.2504
(8.6503-9.7004]………..3………...8…….…9.1753………...27.5259

Σ= 62.9014


Ẋ= 62.9014/8= 7.8626

Interpretación: “Si todos los alumnos tuvieran la misma calificación, ésta sería de 7.8626”

MEDIANA
8 –PAR

n/2 = 8/2 = 4° y 5° (posiciones en Fa)

Me= (7.6002-8.6503]—Mc =8.1252

Interpretación: “El 50 % de los alumnos obtuvo una calificación inferior a 8.1252, el otro 50% obtuvo una calificación superior a 8.1252”

CLASE MODAL

Mo= (8.6503-9.7004]

Interpretación: “La mayoría de los alumnos obtuvo una calificación entre 8.6503 y 9.7004”

B) MEDIDAS DE DISPERSIÓN

VARIANZA
Ẋ= 7.8626

6.2-7.8626= (-1.6626) (-1.6626)= 2.7642

9.7-7.8626= (1.8374) (1.8374)= 3.3760

5.5-7.8626= (-2.3626) (-2.3626)= 5.5818

8.2-7.8626= (0.3374) (0.3374)= 0.1138

8.2-7.8626= (0.3374) (0.3374)= 0.1138

8.9-7.8626= (1.0374) (1.0374)= 1.0761

9.3-7.8626= (1.4374) (1.4374)= 2.0661

7.5-7.8626= (-0.3626) (-0.3626)= 0.1314


Ϭ2= Σ/n-1
Ϭ2= 15.2232/7 = 2.1747


DESVIACIÓN ESTÁNDAR

Ϭ2= 2.1747

Ϭ= √2.1747= 1.4747


COEFICIENTE DE VARIACIÓN

C.V. = 1.4747/ 7.8626 (100%)

C.V. = 0.187558 (100%)

C.V. = 18.7558 %

Interpretación: “Existe una variación de 18.7558 % de los datos con respecto al valor de la media”

C) GRAFICAR EL HISTOGRAMA

Véase figura 18. Recordemos que el histograma es el grafico que nos permite saber si existe una distribución normal (forma de campana) de los datos y por consiguiente nos permite determinar cuál de las dos reglas vamos a aplicar. En este caso será la regla de Chebyshev. 


D) REGLA DE CHEBYSHEV
Considerando:
K=3
Ẋ= 7.8626
Ϭ= 1.4747

1ª fórmula
(Ẋ-Ks, Ẋ+Ks)
= (7.8626-3(1.4747), 7.8626+3(1.4747)]
= (7.8626-4.4241, 7.8626+4.4241)
= (3.4385, 12.2867]
2ª fórmula
1-1/K2 (100 %)
= 1-1/32 (100%) = 1-1/9 (100%) = 1-0.1111 (100%)
= 0.8889 (100%)
= 88.89 %
Interpretación: “Por lo menos el 88.89 % de los datos cumple con la característica del intervalo (3.4385, 12.2867].”



Evidencia 19 (14-Noviembre)
Hoy, en la clase de Estadística repasamos los temas sobre la Regla empírica y la Regla de Chebyshev, así que solamente reafirme mis conocimientos.
Entonces, de acuerdo a la definición que el equipo expositor explicó, podemos decir que la función de la Regla empírica es “medir cómo se van distribuyendo los valores por encima y por debajo de un valor central (media).” Para conocer dicha distribución empleamos un grafico (como el Histograma) para poder entender la manera cómo a la Media se le van sumando y restando el resultado de la Desviación estándar.
Recordemos que para que la Regla empírica pueda determinarse es necesario que en el histograma graficado veamos una “distribución normal”, es decir, de forma acampanada; una vez identificado que nuestro gráfico cumple con esa condición, entonces procedemos a determinar dicha regla de acuerdo al porcentaje que queramos obtener. Este porcentaje está en relación a las tres fórmulas de la Regla empírica:
1)     (x-σ),(x+σ) --> obtenemos aproximadamente 68 % de la distribución. 
2)     (x-2σ),(x+2σ) --> aprox. 95%
3) (x-3σ),(x+3σ) --> aprox. 99 e incluso 100% 
Entonces, de acuerdo al porcentaje que deseemos obtener, es que vamos a sumar y restar 1, 2 ó 3 desviaciones estándar. Lo anterior se puede entender de la siguiente manera: “por un lado vamos a posicionar la media en el histograma, para calcular la primera parte de la fórmula (la resta) procedemos a restar el valor de la media menos 1 desviación estándar (si es que queremos calcular el 68% de la distribución), dicha resta nos dará como resultado el límite inferior del intervalo. Por otro lado, para calcular la segunda parte de la fórmula (la suma) vamos a sumar el valor de la media más 1(cuando queremos saber el 68% de la distribución), dicha suma nos dará como resultado el límite superior del intervalo.” Cabe mencionar que para cuando queramos saber el 95%, 99% o 100% de la distribución, las desviaciones estándar consideradas aumentaran (puede ser 2 ó 3), número que se multiplicara al valor de la desviación estándar.
Como vemos, el procedimiento anterior se explica en la figura 19.
Asimismo, aprendí que la Regla empírica nos permite obtener un resultado más exacto acerca de la variación de los datos. Y ésta, al igual que la Regla de Chebyshev, nos complementan la mediana, y nos dan la oportunidad de hacer cortes más precisos.
Finalmente,  la Regla de Chebyshev se diferencia de la empírica porque ésta no necesita tener una distribución normal (en el histograma) para poder ser aplicada.

No hay comentarios:

Publicar un comentario