miércoles, 5 de diciembre de 2012

Resumen general de Estadística

La estadística es una rama de las matemáticas que se encarga de la jerarquización, analización y recolección de datos que serán de utilidad en una investigación. En la pedagogía, la estadistica es una ciencia fundamental para transformar datos cualitativos en datos cuantitativos. 
La población son todos los valores que toman la variable, y la muestra es una pequeña parte, sirve para darse cuenta de como esta la población, es una pequeña parte de la población.
Cuando hay valores existe la posibilidad de que los datos se repitan a esto se le llama frecuencia absoluta. La frecuencia relativa, la cual es el número de veces que se repite un valor, con respecto al total de los datos.
- La variable es aquella característica que se puede medir, podemos poner como ejemplo la estatura, el tiempo, el peso, etc.
- Numéricas son todas aquellas variables que contienen números.
- Categóricas que son todas aquellas variables que son contables pero son representadas mediante palabras
A su vez estos dos tipos de variables se subdividen en dos.
Las numéricas se dividirán en:
- Discretas que son todas aquellas características que se representaran con números enteros. Ejemplo la edad.
- Continuas que son todas aquellas características que se representaran con numero decimal, por ejemplo la estatura.
Las variables categóricas se derivaran en dos tipos:
- Ordinales que son todos aquellas características que tienen jerarquía, ya sea de mayor o menor o de menor a mayor. Un ejemplo el nivel educativo.
- Nominales, que son todas aquellas características en las que según al criterio de cada quien se pueden ordenar. Por ejemplo: el sexo.
Cabe mencionar que hay factores que pueden presentarse en dos tipos de variables, un ejemplo de esto es el tiempo, ya que el tiempo puede ser representado por número entero o por continuo, y a estos factores se les llaman ambiguos.
Las medidas de tendencia central son aquellas que nos permiten entender lo que sucede en el centro de esa base de datos.
- La moda: es el valor que se repite con mayor frecuencia. es utilizada en el valor numérico continuo y discreto, y en los categóricos ordinal y nominal.
- La mediana es el valor que divide a la población en dos partes iguales. Se aplicada en la variable numérica continua y discreta, y categórica ordinal. Esta se describe en porcentajes del 50% mayor que y el 50% menor que.
- La media : es la suma de los valores por la cantidad de los mismos. Es utilizada en el valor numérico continuo y discreto, y en los categóricos ordinal y nominal. Un ejemplo para transcribir esos datos a cualitativo puede ser la siguiente, retomando la edad: si tuvieran un mismo numero de años tendrían 6.7 años.
En datos agrupados se organizara la variable por intervalos. Los intervalos serán de la siguiente manera:
- Menos de 10 4
- De 10-20 5
- De 20-45 6
- De 45-90 7
- De 90-180 8
- De 180-360 9
- De 360-720 10
- Mas de 720 entre 10-20
Estos intervalos servirán de base para elaborar intervalos ajenos a estos. Para obtener los intervalos se resta el valor mínimo del conjunto de datos, menos el valor máximo del mismo conjunto, el resultado de esta resta se dividirá entre el intervalo que corresponda al total del numero de datos, y al resultado se le sumara 1.

La marca de clase se obtiene sumando el dato mayor del rango mas el dato menor del mismo rango, se divide entre dos y esto resultara la marca de clase.
El siguiente paso es multiplicar el valor de la marca de clase por la frecuencia absoluta de la clase, esta se obtiene sumando el primer valor de la frecuencia absoluta mas el segundo y el segundo con el tercero, y así sucesivamente.
Por ultimo se suman todos los resultados que se obtuvieron a partir de la multiplicación y se divide entre el total de valores (250,300,…), y así se obtiene la media.
- La moda la obtenemos a partir de el valor con mas repetitividad, pero este se ubica en el rango y el resultado será el rango en el que se encuentra el valor con mayor frecuencia.
- La mediana se obtiene a partir de la división de todos los datos agrupados entre dos, si es par se tendrá que utilizar el valor consecutivo del que nos resulto. Este resultado se ubicara en la tabla de frecuencia acumulada, y se colocara como resultado el rango a que pertenece el valor. Para rectificar se sumara el primer valor del rango mas el segundo valor entre dos.

Las medidas de dispersión son aquellas medidas que nos van a permitir medir que tan dispersos están los datos. Es decir cuantos datos están a la derecha y a la izquierda y que tan alejados están de las medidas centrales.
Estas medidas son:
- Rango: esta se obtiene de la resta de el valor mas grande menos el valor mas pequeño.
- Varianza: es aquel valor numérico que mide la separación con respecto a la media. Esta se obtiene restando el dato menos la media, y este resultado se elevara al cuadrado. Este procedimiento se repetirá con cada uno de los valores, estos resultados se sumaran y se dividirán por la media menos uno. (DATO-MEDIA=RESULTADO2 = R2
LA SUMATORIA DE R2/MEDIA-1=VARIANZA)
- La desviación es el despeje de la formula de la varianza; si la varianza es sigma minúscula al cuadrado esta será sigma a la raíz cuadrada. Esta se obtiene tras la raíz cuadrada de la varianza.
- El coeficiente es aquel que permitirá comparar la dispersión entre dos variables. El C.V. se obtiene con la división de la desviación entre la media y el resultado se multiplicara por cien y se obtendrá el porcentaje
(C.V.= DESVIACION/MEDIA=RESULTADO (100)=C.V.%). Y este se describirá de la siguiente manera: existe una variación de % de los datos con respecto al valor de la media.

La regla de Chevichev permite alejar la variable aleatoria de la media, mediante el uso de la media y la desviación estándar, su formula es la siguiente: (x – ks, x + ks) y el porcentaje se obtiene con la formula (1 – 1/ks). Siendo s= Desviación y k= un valor mayor a uno. Esta formula va a permitir obtener intervalos ante una distribución irregular. Y esta se traduce de la siguiente manera: al menos el (porcentaje) de los datos están entre (resultado de la primer formula).
Cuando se presenta una distribución normal se ocupara la regla empírica, la cual sirve para percibir de manera grafica la desviación estándar que se presenta en los datos. Su formula es la siguiente:
- (x – desviación), (x + desviación) 68% de los datos
- (x – 2desviación), (x + 2desviacion) 95% de datos
- (x – 3desviación), (x + 3desviación) 99% de los datos

La regla empírica nos va a servir para obtener un porcentaje mas exacto mediante intervalos, la formula va de acuerdo al porcentaje requerido:
(Media – Varianza ), (Media + Varianza) 68%
(Media – 2Varianza), (Media + 2Varianza) 95%
(Media – 3Varianza), (Media + 3Varianza) 99%
Los resultados de cada una de las formulas serán los intervalos que nos van a dar la siguiente interpretación:
- Al menos el (PORCENTAJE) de los datos se encuentra (o esta en) el interior del intervalo (RESULTADOS DE LA FORMULA).
La regresión lineal es aquella fórmula matemática que nos va ayudar a entender una hipótesis, ya sea para comprobar o descartar ese planteamiento.
Es aquella línea que más se asemeja a los datos. Su fórmula es:
Y = a + bx
Primero es necesario obtener los resultados de a, b y r (coeficiente de correlación lineal), con estos datos y con el dato menor y el dato mayor de cada columna podemos obtener los intervalos donde se localiza esa línea que cruza y al mismo tiempo une los puntos que se establecieron con anterioridad. La regresión lineal requiere de dos instrumentos base: un diagrama de dispersión, el cual nos ayudara a percibir de que manera esta la línea de regresión. La línea de regresión puede ser decreciente (cuando b y r son negativos), y creciente (cuando b y r son positivos).
R= nos indicara si nuestra correlación es perfecta o nula entre las variables.

Tema 6: Regresión lineal



REGRESIÓN LINEAL 

Evidencia 20 (16-Noviembre) 
En la clase de hoy aprendí muchos aspectos acerca del tema “Regresión lineal.” Ésta es definida como un procedimiento estadístico que en primer lugar nos permite conocer la relación existente entre dos o más variables estudiadas, y en segundo lugar nos da la oportunidad de estimar o realizar predicciones sobre lo que puede pasar en un futuro de acuerdo a dicha relación de variables. Por ejemplo, consideremos que se estudiarán las variables “Horas diarias que duermen los alumnos de 3er. año de la EST 113” y “El promedio obtenido durante el primer bimestre.” En este caso, ambas variables se relacionan pues las horas que duerme un alumno (muchas, regular, pocas) inciden directamente en el aprovechamiento académico que tengan y por consiguiente en su promedio bimestral. Así, podremos estimar que si un alumno no duerme lo suficiente, entonces su desempeño será deficiente y su promedio bimestral muy bajo; por el contrario, si un alumno duerme bien entonces su desempeño será mejor y su promedio más alto. Y es respecto a lo anterior que decimos que la Regresión lineal forma parte inferencial de la Estadística. 
Además del concepto y utilidad de la Regresión lineal, aprendí la manera de calcularla, es decir, su procedimiento y los elementos de éste. De tal modo, en la regresión lineal se emplea el Diagrama de Dispersión (véase figura 20), el cual nos permite graficar las variables estudiadas a manera de coordenadas y mediante puntos, a partir de dichos puntos es posible obtener la “Línea de regresión”, la cual se puede obtener a través de la siguiente ecuación o fórmula general: 
Ŷ= a+bx 
Dicha fórmula, como ya se mencionó, nos permite representar en el diagrama los puntos y de ahí obtener la línea de regresión. Para esto es necesario determinar los valores de “a”, “b”, “x” y “r” (Coeficiente de correlación). Así, el procedimiento se realiza mediante la calculadora científica (lo cual es sumamente sencillo), y se resume a continuación: 
1)Presionar MODE--> REG--> Lin--> Colocar los valores, como por ejemplo: 
3,10-->M+--> n=1 
4,9--> M+--> n=2 
5,9--> M+--> n=3 
Y así sucesivamente, hasta terminar con todos los datos.  
2) Una vez insertado el último valor, presionamos: Shift 2--> Seleccionar “a”. De esta manera calcularemos el valor de “a”. 
El procedimiento anterior también se lleva a cabo para calcular “b” y “r”, sólo que después de Shift se deben seleccionar sus respectivas letras.  Asimismo, decimos que, cuando tenemos un diagrama de dispersión decreciente, los valores de “b” y “r” deberán ser negativos. 
3) El valor de “x” será nuestro valor más pequeño y el más grande, a los cuales llamaremos x1 y x2, respectivamente.  
4) Procedemos a sustituir los valores, dentro de nuestra fórmula general: Ŷ= a+bx 
Entonces obtendremos 2 “coordenadas”, la resultante de usar x1, y la de x2. A cada una de éstas también le corresponderá un valor de Ŷ: Ŷ1 y Ŷ2, respectivamente.  Por ejemplo: 
Ŷ= a+bx 
a= 10.4350 
b= -0.3649 
r= -0.9844 

UTILIZANDO --> X1= 0 (Valor menor) 
Ŷ= 10.4350 + (-0.3649) (0) 
Ŷ1= 10.4350 (0) 
Ŷ1= 10.4350 
UTILIZANDO --> X2= 17 (Valor mayor) 
Ŷ2= 10.4350 + (-0.3649) (17) 
Ŷ2= 10.4350 + (-6.2033) 
Ŷ2= 4.2317 
Entonces tenemos:  
X1= 0   
Ŷ1= 10.4350 
X2= 17 
Ŷ2= 4.2317 
Estos últimos valores (X1, Ŷ1) y (X2, Ŷ2), son los que graficaremos en el diagrama de dispersión para obtener matemáticamente la “Línea de regresión.” Así, ésta nos permite el nivel de correlación entre las variables (véase figura 21), la cual puede ser perfecta o nula dependiendo cuánto se acerque el valor del Coeficiente de correlación (r) a 1 o a 0.  Respecto a nuestro ejemplo diremos que: “Las variables si tienen una relación, la cual es casi perfecta.”  
Finalmente, el procedimiento anterior puede ser aplicado para realizar una predicción acerca de cualquier dato de nuestras variables estudiadas. Así, podemos observar la importancia de la Regresión lineal, puesto que ésta nos ayuda a conocer la relación existente entre variables (ya no las considera de forma independiente), y a su vez, nos deja inferir lo que es probable que suceda a partir de dicha relación; enriqueciendo, de tal modo, los estudios y análisis estadísticos, ya que las interpretaciones, comparaciones y conclusiones serán mucho más concisas y confiables.
Ŷ= a+bx. 



(r), entonces se establece que: 
Si r se acerca a 1--> Existirá una correlación perfecta 
Si r se acerca a 0--> Existirá una correlación nula. 

Evidencia 21 (21-Noviembre) 
El día de hoy en la clase de Estadifica continuamos revisando el tema de Regresión Lineal; con lo cual pude refirmar mis conocimientos acerca de cómo realizar las operaciones en la calculadora científica, éstas para poder aplicar la fórmula general, es decir, la ecuación que nos permite obtener la Línea de regresión. Recordemos que la Línea de regresión nos da la oportunidad de conocer la correlación de las variables estudiadas, dicha correlación se puede definir como alta, moderada o baja, y de acuerdo con el porcentaje del CC (coeficiente de correlación) es posible saber si la relación es perfecta o nula.  
Así, de acuerdo con lo aprendido,  se explica el siguiente ejemplo:  
En una escuela secundaria se desea conocer si existe una relación entre las horas que ven la televisión diariamente los alumnos de 3er año y su aprovechamiento académico, el cual se ve reflejado en el promedio del 5to semestre, para ello se llevo a cabo una encuesta obteniendo los siguientes resultados: 
Hrs diarias que ven TV…… Promedio del 5to. Semestre  
(X)..………………………………………………(Y) 
4………………………………………………….. 8.0 
7…………………………………………………..6.5 
2…………………………………………………..9.0 
3…………………………………………………..8.5 
1…………………………………………………..9.5 
0…………………………………………………..10 
5…………………………………………………..7.5 
8……………………………………………………6.0 
10………………………………………………….5.0 

A) Determinar a,b y el coeficiente de correlación.  
a= 10 
b= -0.5 
r= -1 
B) Aplicar la ecuación general de la Regresión lineal Ŷ= a+bx, considerando tanto el valor menor y el mayor de la columna de X. 
UTILIZANDO --> X1= 0 (Valor menor) 
Ŷ= 10 + (-0.5) (0) 
Ŷ1= 10 + 0 
Ŷ1= 10 
UTILIZANDO --> X2= 10 (Valor mayor) 
Ŷ2= 10 + (-0.5) (10) 
Ŷ2=  10 + (-5) 
Ŷ2= 5 
C) Graficar el Diagrama de Dispersión. (Véase figura 22).  
Entonces, los valores que serán graficados en el diagrama de dispersión, son: 
1) 0,10 
2) 10,5 
Así, obtenemos la línea de regresión, permitiéndonos saber cuán estrecha o no es la relación entre la variable “Horas diarias que ven la TV los alumnos” y “Promedio obtenido durante el 5to semestre.” 
D) Realizar la predicción con el valor de 9, en X. 
Ahora bien,  la regresión lineal nos permite hacer predicciones o estimar lo que puede pasar. Así, si los alumnos vieran 9 horas la TV, su promedio del 5to semestre podría ser: 
Ŷ= 10 + (-0.5) (9) 
Ŷ= 10 + (-4.5) 
Ŷ= 5.5 
En este caso, la predicción si coincide con los datos que tenemos, por esta razón decimos que existe una correlación alta y perfecta entre las variables. Entonces, observamos que si un alumno dedica muchas horas para ver la televisión, es muy probable que afecte en su rendimiento académico, el cual se reflejará en su promedio semestral.  
Finalmente, otra cosa que aprendí es que si los datos se invierten, es decir, la columna X se considera como la columna Y, y viceversa, observaremos cómo el resultado del coeficiente de correlación se conserva, mientras que los resultados de a y b cambian y por consiguiente, la línea de regresión también cambia de posición en el diagrama de dispersión.  
Entonces, suponiendo que: 
Hrs diarias que ven TV…… Promedio del 5to. Semestre  
(X)..…………………………….…(Y) 
8.0…………………………………..4 
6.5…………………………………..7 
9.0…………………………………..2 
8.5…………………………………..3 
9.5……………………………….….1 
10……………………………….…..0 
7.5……………………………….….5 
6.0………………………………..….8 
5.0…………………………..……...10 

a= 20 
b= -2 
r= -1 

UTILIZANDO --> X1= 5.0 (Valor menor) 
Ŷ= 20 + (-2) (5.0) 
Ŷ1= 20 + (-10) 
Ŷ1= 10 
UTILIZANDO --> X2= 10 (Valor mayor) 
Ŷ2= 20 + (-2) (10) 
Ŷ2= 20 + (-20) 
Ŷ2= 0 
Entonces, los valores que serán graficados en el diagrama de dispersión, son: 
1) 5.0, 10 
2) 10,0 
Así, la línea de regresión es diferente a la que obtuvimos en el diagrama de dispersión anterior.
Evidencia 22 (23-Noviembre) 

En la clase de hoy retomamos los temas anteriores, al realizar un ejercicio en el cual teníamos que determinar las Medidas de Tendencia Central, las Medidas de Dispersión y la regla Empírica o de Chebyshev. Asimismo abordamos el tema de Regresión lineal del cual aprendí que para poder aplicar dicho procedimiento es necesario que nuestras variables estudiadas sean numéricas, puesto que si alguna es categórica (ya sea nominal u ordinal) no podremos calcularla, porque éstas últimas variables no se pueden ingresar a la calculadora por ejemplo, además que evidentemente sus resultados no son  numéricos, aspecto imprescindible para obtener “a”, “b” y “r”, para calcular la línea de regresión y para conocer si existe una correlación entre las variables.  
Por ejemplo, si tenemos las variables “Sexo” (masculino o femenino) y “Promedio de primer año de la universidad”, observamos que la primera se trata de una variable categórica nominal (puesto que no se puede ordenar,) y la segunda es una variable numérica continua. Así, no podemos hacer una correlación debido a que el tipo de variables no coinciden; entonces la única condición para poder aplicar la Regresión lineal es que las variables sean numéricas (continuas o discretas).  

Así, a partir de lo que ya conozco acerca de los temas ya visto, propongo el siguiente ejemplo: 
“En la UPN 153 se desea conocer el porqué del bajo rendimiento académico que tienen los alumnos del 3° semestre. Se cree que esto puede deberse en gran manera a que los alumnos dedican mucho tiempo a navegar por internet y estar en las redes sociales, lo cual supone que la atención a la realización de sus tareas, trabajos y al estudio en general es muy poca.  Se encuestó a una muestra de los alumnos, preguntándoles cuántas horas diarias navegan en internet y usan las redes sociales, y cuántas horas diarias dedican a realizar sus tareas y a estudiar; de tal modo se obtuvieron los siguientes resultados: 
Hrs diarias en internet……………………….Hrs diarias para hacer la tarea y estudiar 
(X)……………………………………………………………………………(Y) 
5………………………………………………………………………………..2 
7………………………………………………………………………………..0 
2…………………………………………………………………………………4 
0…………………………………………………………………………………5 
8…………………………………………………………………………………0 
4…………………………………………………………………………………3 
10……………………………………………………………………………….0 
6…………………………………………………………………………………1 

  1. Obtener las MTC para la variable X, e interprételas.  
Clase……………………..FA….Fa………Mc…………..Mc*Fi 
0-2.5001………………..2…….2………..1.2500……..2.5001 
2.5001-5.0002……….2……..4………..3.7501…….7.5003 
5.0002-7.5003……….2……..6………..6.2502……12.5005 
7.5003-10.0004………2……..8……….8.7503…….17.5007 
MEDIA 
X= 5.0002 
“Si todos los alumnos dedicaran el mismo numero de horas a navegar por internet y utilizar las redes sociales, éste sería de 5.0002 horas diarias.” 
MEDIANA 
Me= (2.5001-5.0002) 
“El 50% de los alumnos dedica más de 3.7501 horas diarias para navegar por internet y utilizar las redes sociales, el otro 50% dedica menos de 3.7501 horas diarias para realizar la misma actividad.” 
CLASE MODAL 
Mo= En este caso todos los intervalos tienen la misma frecuencia (2), por lo que resulta un poco irrelevante este dato para nuestro análisis estadístico. La interpretación también resultaría un tanto irrelevante: 
“La mayoría de los alumnos dedican entre 0 y 10.0004 horas diarias para navegar por internet y utilizar las redes sociales.” 
b) Determinar las Medidas de Dispersión para la variable X, e interprételas.  
VARIANZA 
5-5.0002= (-0.0002) (-0.0002)= 0.0004 
7-5.0002= (1.9998) (1.9998)= 3.9992 
2-5.0002= (-3.0002) (-3.0002)= 9.0001 
0-5.0002= (-5.0002) (-5.0002)= 25.0020 
8-5.0002= (2.9998) (2.9998)= 8.9988 
4-5.0002= (-1.0002) (-1.0002)= 1.0004 
10-5.0002= (4.9998) (4.9998)= 24.9980 
6-5.0002= (0.9998) (0.9998)= 0.9996 
σ2= 73.9985/7 = 10.5712 
DESVIACIÓN ESTÁNDAR 
σ= √10.5712= 3.2513 
COEFICIENTE DE VARIACIÓN 
C.V.= 3.2513/5.0002 (100%) 
C.V.= 0.650242 (100%) = 65.0242 
“Existe una variación de 65.0242 % de los datos con respecto al valor de la media." 
c) Aplicar la regla empírica o de Chebyshev 
Regla de Chebyshev 
K=3 
1ª fórmula  
(X-Ks, X+Ks) 
= (5.0002- (3) 3.2513, 5.0002+ (3) 3.2513) 
= (5.0002- 9.7539, 5.0002+ 9.7539) 
= (-4.7537, 14.7541) 
2ª fórmula 
1-1/K2 (100%) 
= 1-1/9(100%)  
= 1-0.1111 (100%) 
=0.8889 (100%) = 88.89 % 
“Al menos el 88.89 % de los datos se encuentran dentro del intervalo  (-4.7537, 14.7541).” 

d) Calcular la regresión lineal. 
a= 4.9285 
b= -0.5816 
r= -0.9618... “La correlación entre las variables es alta y casi perfecta.”  

X1= 0 

Ŷ= a+bx 
Ŷ1= 4.9285 + (-0.5816) (0) 
Ŷ1= 4.9285 

(0, 4.9285) 

X2= 10 

Ŷ= a+bx 
Ŷ1= 4.9285 + (-0.5816) (10) 
Ŷ1= -0.8875 

(10, -0.8875) 

Predicción, Si los alumnos dedicaran 1 hora diaria a navegar por internet y usar las redes sociales, el tiempo que dedicarían a la elaboración de tareas y a estudiar sería: 

Ŷ= a+bx 
Ŷ= 4.9285 + (-0.5816) (1) 
Ŷ= 4.3469 

Podemos decir que si existe una relación entre las variables “Horas diarias para navegar por internet y utilizar las redes sociales” y “Horas diarias para realizar las tareas y estudiar”, ya que la primera incide negativamente sobre la segunda, reduciendo el tiempo que los alumnos deberían dedicar a las labores de la Universidad, lo que finalmente se verá reflejado en un aprovechamiento académico deficiente.  



Evidencia 23 (28-Noviembre) 
El día de hoy, en la clase de Estadística revisamos el tema de Regresión Lineal. Así, de acuerdo a los conocimientos que ya poseo, propongo el siguiente ejemplo: 
“En una escuela primaria se desea conocer la relación existente entre las horas de atención que reciben los alumnos por parte de sus padres al realizar sus tareas a la semana y el promedio obtenido durante el último bimestre. Se obtuvieron los siguientes resultados: 
No. de horas que reciben de sus padres…………………… Promedio Bimestral 
X…………………………………………………………………………………………Y 
0.4………………………………………………………………………………………6.3 
1.8………………………………………………………………………………………7.0 
3.5………………………………………………………………………………………7.6 
4.7………………………………………………………………………………………8.3 
5.0………………………………………………………………………………………8.7 
5.6………………………………………………………………………………………9.0 
6.2………………………………………………………………………………………9.3 
6.9………………………………………………………………………………………9.5 
a= 6.0329 
b= 0.5113 
r= 0.9939 

Ŷ= a+bx 

UTILIZANDO --> X1= 0.4 (Valor menor) 
Ŷ= 6.0329 + (0.5113) (0.4) 
Ŷ1= 6.0329 + 0.2045  
Ŷ1= 6.2374 
(0.4, 6.2374) 

UTILIZANDO --> X2= 6.9 (Valor mayor) 
Ŷ2= 6.0329 + (0.5113) (6.9) 
Ŷ2= 6.0329 + 3.5279 
Ŷ2= 9.5608 
(6.9, 9.5608) 

Predicción  
Si  los padres dedicaran 2.0 horas semanales a los alumnos para realizar sus tareas, el promedio bimestral que obtuvieran podría ser: 

UTILIZANDO --> X= 2.0 
Ŷ2= 6.0329 + (0.5113) (2.0) 
Ŷ2= 6.0329 + 1.0226 
Ŷ2= 7.0555 
(2.0, 7.0555) 

Ahora bien, ¿cuántas horas semanalmente deben dedicar los padres a los alumnos para obtener un promedio bimestral de 10? 
Para esto, simplemente invertimos las columnas X y Y, como a continuación: 
Promedio…………Horas de atención  
X…………………….…Y 
6.3……………………0.4 
7.0……………………1.8 
7.6……………………3.5 
8.3…………………..4.7 
8.7…………………..5.0 
9.0……………….….5.6 
9.3……………….….6.2 
9.5………..…………6.9 
a= -11.6062 
b= 1.9322 
r= 0.9939 

Ŷ= a+bx 

UTILIZANDO --> X = 10 
Ŷ= -11.6062 + (1.9322) (10) 
Ŷ= 7.7158 
“Los padres necesitan dedicar 7.7158 horas semanalmente a los alumnos para que éstos puedan obtener un promedio bimestral de 10.”