miércoles, 1 de octubre de 2008

2.1 Definición del ANOVA

El analisis de varianza comunmente conocido como Anova, por lñas iniciales que se obtienen del nombre en ingles (analysis of variance) se fundamenta en el estudio de las varianzas. Como establece diferencia entre las medias poblaciones; es un método matico creado para probar la hipotesis de que las medias aritemticas de más de 2 grupos poblacionales son iguales.


Iniciaremos la exposición del tema dando el siguiente ejemplo
ilustrativo
. Cierto investigador lleva a cabo un experimento con el
propósito de determinar el impacto que produce el ruido en el nivel
de comprensión de lectura. Específicamente se quieren identificar las
consecuencias de las distracciones y perturbaciones auditivas en los
Estudiantes de una universidad.

Para realizar la investigación, selecciona al azar 30 alumnos de la institución.
Posteriormente los agrupa en tres conjuntos de 10 estudiantes cada uno. A los
individuos del grupo I les da 35 minutos para que lean una historia en una
sala de lectura en la que no hay ruido ni ninguna distracción. Simultáneamente,
a Tos sujetos del grupo II les da la misma historia y el mismo tiempo que a los del
grupo I, sólo que ellos realizan la lectura en una sala donde se puede identificar
la presencia de ruido moderado. Por último, a los estudiantes del grupo III
se les da la misma narración y el mismo tiempo que a los otros dos grupos.
Únicamente que ellos realizan la lectura en la cafetería de la universidad, en la
que hay mucho ruido y muchas posibles causas de distracción auditiva. Es decir,
a los 3 grupos de estudiantes se les dio un tratamiento distinto.

Transcurridos los 35 minutos que destinaron los alumnos a leer la historia.
se junta a los tres grupos y se les aplica un mismo examen de comprensión de
/ lectura. La idea del investigador es medir (de alguna manera), la retención de
los alumnos respecto a la historia que acaban de leer,


Posteriormente se califican los 30 exámenes, se clasifican por grupo y se
determina la calificación promedio que se obtuvo de cada una de las tres muestras.

Puesto que, a los tres conjuntos de alumnos se les dio un tratamiento
diferente. La pregunta inmediata que el investigador deseará contestar, es: ¿7a
intensidad del ruido y posibles distracciones auditivas tienen efecto en el nivel
de comprensión de lectura de los estudiantes?

En caso de que la respuesta sea afirmativa, se puede esperar que la calificación
promedio de cada uno de los tres grupos sea distinta. Esto es, si la calificación
promedio de los grupos se representa por: x{, x2 y xy respectivamente, y la I
respuesta a la pregunta anterior es afirmativa, entonces estas tres cantidades serán ;
Diferentes. En caso contrario, si la intensidad del ruido y posibles distracciones
auditivas no producen ningún efecto en el nivel de comprensión de lectura de los i
alumnos de las tres muestras, entonces se podrá esperar que esas tres cantidades?
sean iguales (x{ = x2 = Jc3).

En sentido estricto, el analisis de varianza se refiere a la actividad de comparar los valores promedio de una poblacion que ha sido divida en varios subconjuntos. Esta division se hace de acuerdo con los distintos tratamientos que se da a los elementos de la poblacion.


No obstante que el análisis de varianza permite obtener una conclusion que se refiere a la poblacion, éste procedimiento se lleva a acabo a partir de la informacion contenida en una muestra.


Retomamos el caso de nuestro ejemplo. La pobalcion es el total de alumnos de la universidad y ésta se divide en tres subconjuntos :

Subconjunto 1:Los alumnos que comunmente realizan sus tareas de estudio en una sala de lectura que se encuentra en la biblioteca de la universidad.
Subconjunto 2:Los escolares generalmente hacen sus tareas en un auditorio con ruido moderado.
Subconjunto 3:Los alumnos que llevan a cabo sus tareas de estudio en la cafeteria de la universidadm en la que hay mucho ruido.

Supongamos por un momento que a todos los estudiantes de la universidad les dan 35 minutos para leer una historia e inmediatamente después se les aplica el mismo examen de comprensión de lectura. Supongamos también que dicho examen se aplica a los estudiantes cuando están en cualquiera de los tres lugares antes mencionados. Transcurridos los 30 minutos destinados a responder el examen, éstos se recogen, se clasifican (de acuerdo con el lugar donde lo contestaron), se califican y se obtiene la nota promedio de cada uno de los tres subconjuntos de la población.

Un método para determinar la calificación promedio de los tres subconjuntos de la población es mediante un procedimiento de muestreo. Pongamos por caso que se obtiene una muestra de cada uno de los tres subconjuntos. Si (las muestras) x1, X2 y x3 representan las calificaciones promedio de las muestras y (las medias pob) u1, u2 y u3 las calificaciones promedio de los subconjuntos de la población, entonces se puede esperar que x1, sea un valor aproximado a u1 (que x2 sea un valor aproximado a u2 y x3 se aproxime u3): se dice que la media muestral x es un estimador de la media poblacional(u)«.

Un estimador es una fórmula o procedimiento estadístico que permite calcular un valor (aproximado) de un parámetro o característica poblacional.

En el ejemplo, u1 u2, u3 son parámetros y x1, x2, x3 son estimadores.

Siguiendo con la narración de nuestro ejemplo; si las medias de los tres subconjuntos de la población son iguales (u1, =u2 =u3), cabe esperar que las tres medias de las muestras Se aproximen entre sí (x1 diferente a x2 diferente x3 ). De hecho, mientras más próximas estén las medias de las tres muestras, se tendrá mayor evidencia de que las medias poblacionales son iguales.

En contraposición, a medida que los valores de las medias muéstrales sean
diferentes, habrá mayor evidencia de que las medias poblacionales son también
diferentes.


Ejemplo 1

Inversiones de México S.A.


Un analista financiero desea comparar el rendimiento mensual promedio tres carteras de inversión, mismas que están conformadas por instrumentos financieros provenientes de distintos sectores de la economía.

Para tal propósito obtiene una muestra de cada una de las tres opciones: la muestra de la primera cartera consta de cinco instrumentos distintos procedentes: bancos comerciales; la muestra de la segunda cartera está constituida por instrumentos de renta variable que provienen de tiendas al mayoreo; finalmente, la muestra de la tercera cartera de inversión está formada por cinco acciones que proceden de empresas que pertenecen a la industria de la construcción:

Cartera 1
3.40
7.20
5.50
6.50


Cartera 2

4.60
4.55
5.50
6.35
5.55

Cartera 3

6.35
5.50
3.50
4.50
6.30

(Tabla 2.1. Rendimientos mensuales promedio.)

El propósito del analista financiero, es determinar si los tres fondos de inversión producen un rendimiento mensual promedio diferente. De ser así, el analista estará interesado en seleccionar aquel que le da un mayor rendimiento.
En caso contrario (que las tres carteras produzcan el mismo rendimiento), entonces no habrá, a primer a vista, ninguna razón para preferir alguna de ellas i particular.


Otro hecho importante que hay que resaltar es que en este caso se cuenta con 15 acciones que están agrupadas de acuerdo con cierto sector al que pertenecen. En este ejemplo, el factor que se toma en consideración para el análisis es el sector de la economía al que pertenecen las empresas emisoras de dichas acciones, y las tres modificaciones que sufre este factor dan origen a los tres tratamientos: bancos comerciales; tiendas al mayoreo e industria de la construcción.