REGLA EMPÍRICA Y REGLA DE CHEBYSHEV
Evidencia
17 (07-Noviembre)
El día de hoy en la
clase de Estadística, se realizaron ejercicios retomando los temas revisados
previamente: Medidas de Tendencia Central y Medidas de Dispersión. A partir de
la obtención de dichas medidas abordamos la regla empírica y la regla de Chebyshev.
De tal modo, aprendí
que estas reglas tienen como finalidad "complementar la mediana", es
decir, permiten obtener resultados mucho más concisos. Recordemos
que la mediana tiene como objetivo encontrar el dato que se encuentra justo a
la mitad de la muestra, al mismo tiempo que divide en partes iguales a dicha
colección de datos; así cuando decimos que la regla empírica y la de Chebyshev
complementan a la mediana es porque ayudan a obtener resultados concretos a fin
de conocer con mayor precisión cómo es que se están comportando los valores
dentro de una base de datos.
Asimismo, aprendí por un lado, que la regla empírica se aplica siempre y cuando tengamos una distribución normal de los valores en una muestra, esto es generalmente cuando al momento de representar obtengamos gráficas de forma acampanada.
Entonces, si la muestra cumple con esa condición, podremos aplicar 3 distintas fórmulas, éstas son de acuerdo al "resultado porcentual" que deseemos obtener; así, las fórmulas son las siguientes:
1) (x-σ),(x+σ) --> obtenemos aproximadamente 68 % de la distribución.
2) (x-2σ),(x+2σ) --> aprox. 95%
3) (x-3σ),(x+3σ) --> aprox. 99 e
incluso 100%
Como podemos ver, el porcentaje aumenta de acuerdo al número de desviaciones estándar que ocupemos.
Por otro lado aprendí cómo obtener la regla de Chebyshev, ésta se obtiene en los casos cuando no es posible determinar la regla empírica (cuando no hay una distribución normal de los datos). De tal modo, tenemos 2 fórmulas distintas para obtener dicha regla:
1) (x-Ks, x+Ks)--> donde K es cualquier valor superior a 1; y donde s es la desviación estándar.
Así, para comprender mejor la regla
de Chebyshev, consideremos el siguiente ejemplo:
"Supongamos que los resultados
de la media y la desviación estándar de una base de datos son:
x= 106.4300
σ= 100.0936
Entonces sustituimos dichos valores
en la fórmula:
(106.4300-2(100.0936), 106.4300+2(100.0936)
=(106.4300-200.1872, 106.4300+200.1872)
=(-93.7573, 306.6172)
Como vemos el resultado que obtenemos es a manera de un intervalo."
2) 1-1/K2(100%)
"Suponiendo que tenemos:
x= 106.4300
σ= 100.0936
Sustituimos en la fórmula:
1-1/(2)2(100%) = 1- 1/4(100%)
=1-0.25(100%)= 0.75(100%)
= 75%
Como observamos, el resultado se representa en porcentaje, asimismo el valor de K es cualquier valor, éste por el momento es determinado por el profesor."
Finalmente, puedo decir que tanto la regla empírica como la regla de Chebyshev ayudan a conocer más detalladamente cómo es que se está comportando la base de datos estudiada. Asimismo, vemos la importancia que tienen las MTC y las MDD, ya que ambas nos ayudan a determinar las reglas ya mencionadas.
Evidencia18 (09-Noviembre)
El día de hoy en la
clase de Estadística Descriptiva en Educación retomamos los temas ya revisados
con anterioridad, así, se resolvieron ejercicios sobre Medidas de Tendencia
Central y Medidas de Dispersión, incluyendo el último tema visto: la regla empírica
y de Chebyshev.
Con respecto a este último tema, aprendí a realizar las interpretaciones correspondientes para cada regla; por una parte, sabemos que para la regla empírica usamos 3 fórmulas las cuales nos dan como resultado 3 porcentajes o resultados diferentes (éstos dependen de las desviaciones estándar utilizadas para su cálculo); cada resultado nos dice aproximadamente “qué porcentaje de los datos” cumplen con el intervalo que se haya obtenido, entonces con respecto a esto se realiza la interpretación. Por otra parte, pero con mucha relación a la anterior tenemos la interpretación para la regla de Chebyshev mediante la cual podemos saber “el porcentaje de los datos que cumplen con la característica del intervalo.” Sin duda, a pesar de que el procedimiento para obtener cada regla sea diferente, las interpretaciones son similares ya que ambas nos permiten saber con mayor precisión la distribución que está teniendo la muestra de datos analizada.
Para reafirmar estos conocimientos, tenemos el siguiente ejemplo explicado en una publicación previa, no obstante en esta ocasión se le agregará “cómo aplicar y resolver alguna de las dos reglas”, de tal modo lo que he aprendido se muestra a continuación:
Ejemplo:
“Las calificaciones de 8 alumnos de 5° de primaria en su primer examen de español, fueron las siguientes:
6.2, 9.7, 5.5, 8.2, 8.2, 8.9, 9.3, 7.5
a) Determinar las Medidas de Tendencia Central para datos agrupados y sus respectivas interpretaciones.
b) Obtener las Medidas de Dispersión y su interpretación.
c) Graficar el histograma.
d) Aplicar la regla empírica o de Chebyshev, según sea el caso e interpretar."
A) MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
MEDIA
9.7-5.5= 4.2/4= 1.05= 1.0501
Clase……………………..…FA………Fa………...Mc…….…..….Mc*Fi
(5.5-6.5501]………………2….……..2……….6.0250…………12.0500
(6.5501-7.6002]………..1…….…..3……….7.0751…………7.0751
(7.6002-8.6503]………..2…….…..5……….8.1252…………16.2504
(8.6503-9.7004]………..3………...8…….…9.1753………...27.5259
Σ= 62.9014
Ẋ= 62.9014/8= 7.8626
Interpretación: “Si todos los alumnos tuvieran la misma calificación, ésta sería de 7.8626”
MEDIANA
8 –PAR
n/2 = 8/2 = 4° y 5° (posiciones en Fa)
Me= (7.6002-8.6503]—Mc =8.1252
Interpretación: “El 50 % de los alumnos obtuvo una calificación inferior a 8.1252, el otro 50% obtuvo una calificación superior a 8.1252”
CLASE MODAL
Mo= (8.6503-9.7004]
Interpretación: “La mayoría de los alumnos obtuvo una calificación entre 8.6503 y 9.7004”
B) MEDIDAS DE DISPERSIÓN
VARIANZA
Ẋ= 7.8626
6.2-7.8626= (-1.6626) (-1.6626)= 2.7642
9.7-7.8626= (1.8374) (1.8374)= 3.3760
5.5-7.8626= (-2.3626) (-2.3626)= 5.5818
8.2-7.8626= (0.3374) (0.3374)= 0.1138
8.2-7.8626= (0.3374) (0.3374)= 0.1138
8.9-7.8626= (1.0374) (1.0374)= 1.0761
9.3-7.8626= (1.4374) (1.4374)= 2.0661
7.5-7.8626= (-0.3626) (-0.3626)= 0.1314
Ϭ2= Σ/n-1
Ϭ2= 15.2232/7 = 2.1747
DESVIACIÓN ESTÁNDAR
Ϭ2= 2.1747
Ϭ= √2.1747= 1.4747
COEFICIENTE DE VARIACIÓN
C.V. = 1.4747/ 7.8626 (100%)
C.V. = 0.187558 (100%)
C.V. = 18.7558 %
Interpretación: “Existe una variación de 18.7558 % de los datos con respecto al valor de la media”
C) GRAFICAR EL HISTOGRAMA
Véase figura 18. Recordemos que el histograma es el grafico que nos permite saber si existe una distribución normal (forma de campana) de los datos y por consiguiente nos permite determinar cuál de las dos reglas vamos a aplicar. En este caso será la regla de Chebyshev.
D) REGLA DE CHEBYSHEV
Considerando:
K=3
Ẋ= 7.8626
K=3
Ẋ= 7.8626
Ϭ= 1.4747
1ª fórmula
(Ẋ-Ks, Ẋ+Ks)
= (7.8626-3(1.4747), 7.8626+3(1.4747)]
= (7.8626-4.4241, 7.8626+4.4241)
= (3.4385, 12.2867]
2ª fórmula
1-1/K2 (100 %)
= 1-1/32 (100%) = 1-1/9 (100%) = 1-0.1111 (100%)
= 0.8889 (100%)
= 88.89 %
Interpretación: “Por lo menos el 88.89 % de los datos cumple con la
característica del intervalo (3.4385, 12.2867].”
Evidencia 19 (14-Noviembre)
Hoy, en la clase de
Estadística repasamos los temas sobre la Regla empírica y la Regla de
Chebyshev, así que solamente reafirme mis conocimientos.
Entonces, de acuerdo a la
definición que el equipo expositor explicó, podemos decir que la función de la
Regla empírica es “medir cómo se van distribuyendo los valores por encima y por
debajo de un valor central (media).” Para conocer dicha distribución empleamos
un grafico (como el Histograma) para poder entender la manera cómo a la Media
se le van sumando y restando el resultado de la Desviación estándar.
Recordemos que para que la
Regla empírica pueda determinarse es necesario que en el histograma graficado
veamos una “distribución normal”, es decir, de forma acampanada; una vez
identificado que nuestro gráfico cumple con esa condición, entonces procedemos
a determinar dicha regla de acuerdo al porcentaje que queramos obtener. Este
porcentaje está en relación a las tres fórmulas de la Regla empírica:
1) (x-σ),(x+σ) --> obtenemos aproximadamente 68 % de la distribución.
2) (x-2σ),(x+2σ) --> aprox. 95%
3) (x-3σ),(x+3σ) --> aprox. 99 e incluso 100%
Entonces, de acuerdo al
porcentaje que deseemos obtener, es que vamos a sumar y restar 1, 2 ó 3
desviaciones estándar. Lo anterior se puede entender de la siguiente manera:
“por un lado vamos a posicionar la media en el histograma, para calcular la
primera parte de la fórmula (la resta) procedemos a restar el valor de la media
menos 1 desviación estándar (si es que queremos calcular el 68% de la
distribución), dicha resta nos dará como resultado el límite inferior del
intervalo. Por otro lado, para calcular la segunda parte de la fórmula (la
suma) vamos a sumar el valor de la media más 1(cuando queremos saber el 68% de
la distribución), dicha suma nos dará como resultado el límite superior del
intervalo.” Cabe mencionar que para cuando queramos saber el 95%, 99% o 100% de
la distribución, las desviaciones estándar consideradas aumentaran (puede ser 2
ó 3), número que se multiplicara al valor de la desviación estándar.
Como vemos, el procedimiento
anterior se explica en la figura 19.
Asimismo, aprendí que la
Regla empírica nos permite obtener un resultado más exacto acerca de la
variación de los datos. Y ésta, al igual que la Regla de Chebyshev, nos
complementan la mediana, y nos dan la oportunidad de hacer cortes más precisos.
Finalmente, la Regla de Chebyshev se diferencia de la
empírica porque ésta no necesita tener una distribución normal (en el
histograma) para poder ser aplicada.
No hay comentarios:
Publicar un comentario