Contrastes de hipótesis para una o más muestras independientes

  • Antoni Cosculluela Mas

  • Albert Fornieles Deu

  • Jaume Turbany Oset

PID_00284133
Segunda edición: septiembr 2021
© de esta edición Fundació Universitat Oberta de Catalunya (FUOC)
Av. Tibidabo, 39-43, 08035 Barcelona
Autoría: Antoni Cosculluela Mas, Albert Fornieles Deu, Jaume Turbany Oset
Producción: FUOC
Todos los derechos reservados
Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada, reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea este eléctrico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita del titular de los derechos.

Índice

Introducción

Vamos a presentar los diferentes contrastes de hipótesis o pruebas de significación desarrollados para analizar si existen diferencias significativas en distintos estadísticos muestrales (media y proporción), cuando trabajamos con una o más muestras independientes. Consideramos que las muestras son independientes cuando están formadas por sujetos distintos.
Trataremos tres casos posibles:
  • Cuando trabajamos con una única muestra de sujetos.

  • Cuando trabajamos con dos muestras independientes de sujetos.

  • Cuando trabajamos con más de dos muestras independientes de sujetos.

Para cada uno de estos tres casos, desarrollaremos los contrastes de hipótesis correspondientes para los estadísticos más habitualmente analizados (media, proporción o varianza).
Para cada contraste, mostraremos el desarrollo de la prueba, su esquema, un ejemplo resuelto basado en nuestro caso práctico general, su realización mediante Excel y una actividad propuesta para resolver.

Objetivos

En los materiales didácticos de este módulo presentamos los contenidos y las herramientas imprescindibles para conseguir los objetivos siguientes:
  1. Saber efectuar inferencias estadísticas y estudiar asociaciones entre variables, teniendo en cuenta el concepto de probabilidad que hay detrás de estas decisiones.

  2. Saber utilizar el razonamiento estadístico que permita enfrentarse de manera satisfactoria a los problemas derivados de la investigación que habrá de abordar durante su futuro ejercicio profesional.

  3. Saber identificar correctamente las variables implicadas en una situación de investigación real.

  4. Saber plantear, desarrollar y tomar la decisión de una prueba de relación entre una variable categórica con dos valores y una variable cuantitativa.

  5. Saber tomar decisiones correctas y relacionadas con la situación de investigación.

  6. Saber expresar de forma clarificadora los resultados y poder plantear nuevas investigaciones.

1.Contraste para una muestra

Vamos a presentar de manera esquemática el desarrollo de los contrastes de hipótesis para una muestra, tanto de la media de dicha muestra como de la proporción y de la varianza. También presentamos las fórmulas para el cálculo de los respectivos intervalos confidenciales. Para cada una de estas tres pruebas pondremos un ejemplo ilustrativo de su aplicación con los datos de nuestro caso general.

1.1.Contraste de la media de una muestra

Cuando introducimos el tema del contraste de hipótesis y pruebas de significación en el módulo correspondiente, ya ilustramos este subapartado con un contraste de la media de una muestra, por lo que no vamos a volver a explicar el desarrollo de esta prueba, sino que nos remitimos a lo presentado anteriormente.
1.1.1.Esquema de la prueba
1) Hipótesis nula H0: μ = μ0, donde μ0 es la supuesta media poblacional.
2) Hipótesis alternativa H1:
  • μ ≠ μ0 (contraste bilateral o de dos colas).

  • μ < μ0 (contraste unilateral izquierdo).

  • μ > μ0 (contraste unilateral derecho).

3) Estadístico de contraste:
t = x ¯ μ s x ¯
donde:
  • t es el valor t observado.

  • x es la media muestral obtenida.

  • μ es la media poblacional bajo la hipótesis nula.

  • sx es el error típico de la media, que ya sabemos como calcular: s x ¯ = s n .

4) Distribución teórica del estadístico de contraste: t se distribuye según t de Student con n − 1 grados de libertad.
5) Valores críticos para las regiones de aceptación y rechazo de la hipótesis nula.
a) Región de aceptación de la hipótesis nula:
  • Contraste bilateral: tn−1,α/2 < tobservado < tn−1,1−α/2.

  • Contraste unilateral izquierdo: tn−1,α < tobservado.

  • Contraste unilateral derecho: tobservado < tn−1,1−α.

b) Región de rechazo de la hipótesis nula y aceptación de la alternativa:
  • Contraste bilateral: tn−1,α/2tobservadotn−1,1−α/2.

  • Contraste unilateral izquierdo: tn−1,αtobservado.

  • Contraste unilateral derecho: tobservadotn−1,1−α.

6) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la t observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
7) Tomamos la decisión en función de las reglas anteriores.
8) Interpretamos el resultado.
1.1.2.Intervalo de confianza para la media poblacional
Desconocida la varianza de la población: x ± tα/2,n−1sx.
Intervalo: xtα/2,n−1sx ≤ μ ≤ x + tα/2,n−1sx, siendo s x ¯ = s n .

1.2.Contraste de hipótesis para una proporción

1.2.1.Esquema de la prueba
1) Hipótesis nula H0: π = π0, donde π0 es la supuesta proporción poblacional.
2) Hipótesis alternativa H1:
  • π ≠ π0 (contraste bilateral o de dos colas).

  • π < π0 (contraste unilateral izquierdo).

  • π > π0 (contraste unilateral derecho).

3) Estadístico de contraste:
z = P π 0 σ P
donde:
  • z es el valor z observado.

  • P es la proporción muestral obtenida.

  • π0 es la proporción poblacional bajo la hipótesis nula.

  • σP es el error típico de la proporción, que calculamos como: σ P = π ( 1 π ) n .

4) Distribución teórica del estadístico de contraste: z se distribuye según la distribución normal.
5) Valores críticos para las regiones de aceptación y rechazo de la hipótesis nula:
a) Región de aceptación de la hipótesis nula:
  • Contraste bilateral: zα/2 < zobservada < z1−α/2.

  • Contraste unilateral izquierdo: zα < zobservada.

  • Contraste unilateral derecho: zobservada < z1−α.

b) Región de rechazo de la hipótesis nula y aceptación de la alternativa:
  • Contraste bilateral: zα/2zobservadaz1−α/2.

  • Contraste unilateral izquierdo: zαzobservada.

  • Contraste unilateral derecho: zobservadaz1−α.

6) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la z observada (valor p). Si este valor p es mayor que el nivel de significación α aceptamos la hipótesis nula, y si es menor rechazamos esta hipótesis nula y aceptamos la alternativa.
7) Tomamos la decisión en función de las reglas anteriores.
8) Interpretamos el resultado.
1.2.2.Intervalo de confianza para una proporción
P ± zα/2σP
Intervalo: Pzα/2σP ≤ π ≤ P + zα/2σP, siendo σ P = P ( 1 P ) n .
1.2.3.Ejemplo de contraste de hipótesis para una proporción
Para ilustrar el contraste de hipótesis para una proporción, podemos suponer un estudio dentro del contexto del ejemplo práctico general, donde se quiere comprobar la hipótesis de que en el municipio el porcentaje de varones es inferior al 50 % (nivel de significación α = 0,05).
Para verificar la hipótesis anterior seguiremos los pasos habituales de cualquier contraste de hipótesis:
1) Hipótesis nula: π = 0,5.
2) Hipótesis alternativa: π < 0,5 (contraste unilateral izquierdo).
3) Estadístico de contraste:
z = P π 0 σ P
donde:
  • P = 0,40 (hay un 40 % de varones en la muestra de 100 sujetos).

  • π0 = 0,50.

  • σ P = π ( 1 π ) n = 0,5 × 0,5 100 = 0,05 .

  • z = P π 0 σ P = 0,4 0,5 0,05 = 2 .

4) Valor crítico del estadístico de contraste y regiones de aceptación y rechazo de la hipótesis nula:
Para obtener el valor crítico de z, sabiendo que estamos ante un contraste unilateral izquierdo y con un α = 0,05, hemos de obtener en la tablas de la distribución normal, o mediante la función de Excel «DISTR.NORM.ESTAND.INV», aquel valor de z que deja por debajo de sí una proporción de 0,05 de la distribución normal. Este valor es z(0,05) = −1,645. Este valor de z −1,645 determina las regiones de aceptación (zobservada > −1,645) y rechazo (zobservada ≤ −1,645) de la hipótesis nula.
5) Decisión: rechazamos la hipótesis nula y aceptamos la alternativa, porque −2 es inferior a −1,645 y, por lo tanto, el estadístico de contraste observado (zobservada) cae dentro de la región de rechazo de la hipótesis nula.
6) Igualmente, podíamos haber hecho una prueba de significación buscando en la distribución normal, la probabilidad de que z ≤ −2. Esta probabilidad (que será el valor p para esta prueba) se puede obtener con Excel a partir de la función «DISTR.NORM.ESTAND». Esta probabilidad es de 0,023. Como sabemos, si este valor p es inferior al α especificado (en este caso 0,05), podemos rechazar la hipótesis nula y aceptar la alternativa, como sucede en este caso.
7) Interpretación: podemos concluir, con un nivel de significación del 0,05, que a la luz de los datos obtenidos con la muestra de 100 sujetos estudiados el porcentaje de varones de este municipio es inferior al 50 %.

1.3.Contraste de hipótesis para una varianza

1.3.1.Esquema de la prueba
1) Hipótesis nula H0: σ 2 = σ 0 2 , donde σ 0 2 es la supuesta varianza poblacional.
2) Hipótesis alternativa H1: σ 2 σ 0 2 .
En esta prueba no tiene sentido habitualmente el plantear contrastes unilaterales porque el objetivo normalmente es comprobar si una muestra estudiada proviene o no de una población con una determinada varianza.
3) Estadístico de contraste:
χ 2 = ( n 1 ) s 2 σ 0 2
donde:
  • χ2 es el valor del χ2 observado.

  • s2 es la varianza muestral obtenida.

  • σ 0 2 es la varianza poblacional.

4) Distribución teórica del estadístico de contraste: χ2 se distribuye según la distribución χ2 con n − 1 grados de libertad.
5) Valores críticos para las regiones de aceptación y rechazo de la hipótesis nula:
a) Región de aceptación de la hipótesis nula:
χ n 1 , α / 2 2 < χ observado 2 < χ n 1,1 α / 2 2
b) Región de rechazo de la hipótesis nula y aceptación de la alternativa:
χ n 1 , α / 2 2 χ observado 2 χ n 1,1 α / 2 2
6) Si realizamos una prueba de significación, directamente buscamos la probabilidad del χ2 observado (valor p). Si este valor p es mayor que el nivel de significación α aceptamos la hipótesis nula, y si es menor rechazamos esta hipótesis nula y aceptamos la alternativa.
7) Tomamos la decisión en función de las reglas anteriores.
8) Interpretamos el resultado.
1.3.2.Intervalo de confianza para una varianza
( x x ¯ ) 2 χ n 1,1 α / 2 2 < σ 2 < ( x x ¯ ) 2 χ n 1 , α / 2 2
1.3.3.Ejemplo de contraste de hipótesis para una varianza
Para ver un ejemplo de contraste de hipótesis para una varianza, podemos trabajar con la edad de los 100 sujetos estudiados de nuestro caso práctico general. El objetivo podría ser el comprobar si en este municipio se cumple o no la variabilidad habitual en la edad de los sujetos mayores de 18 años. Esta variabilidad habitual en la edad de sujetos adultos se cuantifica en una varianza de 200. Se quiere estudiar si esta varianza puede suponerse para la edad de los habitantes del municipio estudiado, con un nivel de significación de 0,05.
1) Hipótesis nula H0: σ2 = 200.
2) Hipótesis alternativa H1: σ2 ≠ 200.
3) Estadístico de contraste:
χ 2 = ( n 1 ) s 2 σ 0 2
donde:
  • s2 es la varianza de la edad de los 100 sujetos de la muestra (n = 100) y es igual a 188,691.

  • σ 0 2 = 200 .

Por lo tanto:
χ 2 = ( n 1 ) s 2 σ 0 2 = ( 100 1 ) × 188,691 200 = 93,402
4) Valores críticos para las regiones de aceptación y rechazo de la hipótesis nula.
Buscamos en la tabla de χ2 (tabla 4 de las tablas estadísticas del módulo «Anexo») o mediante la función de Excel «PRUEBA.CHI.INV» los valores de χ2 para 99 grados de libertad (de hecho, la tabla ofrece para 100 grados de libertad que es el más próximo) y α = 0,05 (fijaos en que la tabla da el área de la distribución por encima del valor del ji-cuadrado).
χ 99 d f , 0,025 2 = 129,561  y  χ 99 d f , 0,975 2 = 74,222
(Los valores obtenidos con Excel serían algo distintos, concretamente: 73,361 y 128,422)
a) La región de aceptación de la hipótesis nula será:
74,222 < χ2observado < 129,561
b) La región de rechazo de la hipótesis nula será:
74,222 ≥ χ2observado ≥ 129,561
5) Si hubiéramos hecho una prueba de significación, directamente buscaríamos la probabilidad de un χ2 = 93,402 con 99 grados de libertad (valor p). Esta probabilidad, o valor p de esta prueba, se puede obtener mediante la función «DISTR.CHI» de Excel, y es de 0,64 (p = 0,64).
6) Decisión: aceptamos la hipótesis nula porque el estadístico de contraste observado cae dentro de la región de aceptación de dicha hipótesis nula:
74,222 < 93,402 < 129,561,
o también, desde una perspectiva de la prueba de significación, porque el valor p es mayor que el nivel de significación elegido (0,64 > 0,05).
7) Interpretación: de la prueba anterior podemos concluir que la variabilidad de la edad de los habitantes del municipio es igual a la variabilidad habitual en la edad de los sujetos adultos, con un nivel de confianza del 95 % (o con un nivel de significación de 0,05).
Podemos corroborar la conclusión anterior calculando el intervalo de confianza para la varianza poblacional a partir de la varianza de la muestra de 100 sujetos:
Intervalo de confianza:
( x x ¯ ) 2 χ n 1,1 α / 2 2 < σ 2 < ( x x ¯ ) 2 χ n 1 , α / 2 2
obtenemos:
( x x ¯ ) 2 = s 2 × ( n 1 ) = 188,691 × 99 = 18.680,409
y ya sabíamos que:
x 99 d f , 0,025 2 = 74,222  y  x 99 d f , 0,975 2 = 129,561
entonces:
( x x ¯ ) 2 χ n 1,1 α / 2 2 < σ 2 < ( x x ¯ ) 2 χ n 1 , α / 2 2 18.680,409 129,561 < σ 2 < 18.680,409 74,222 144,182 < σ 2 < 251,683
Interpretación: el intervalo de confianza para la varianza poblacional va de 144,182 a 251,683 y, como dentro de este intervalo tenemos el valor de 200 de la hipótesis nula, debemos aceptar dicha hipótesis nula, y concluir como en el contraste de hipótesis, que la variabilidad de la edad de los habitantes del municipio es igual a la variabilidad habitual en la edad de los sujetos adultos, con un nivel de confianza del 95 %.

2.Contrastes para dos muestras independientes

En los apartados anteriores sobre inferencia estadística nos hemos interesado por un conjunto único de observaciones y por sacar conclusiones sobre la media, la proporción o la varianza de la población subyacente. Ahora pasaremos a considerar dos conjuntos de observaciones realizadas sobre unidades muestrales diferentes. En este caso, hay dos poblaciones, cada una con una media, una proporción o una varianza propia, y a nosotros nos interesará comparar estas medias, proporciones o varianzas contrastando hipótesis sobre su diferencia y construyendo intervalos de confianza para esta diferencia.

2.1.Contraste para dos medias en muestras independientes

En este subapartado veremos el contraste de dos medias en muestras independientes. Utilizaremos este contraste cuando queramos comprobar o estudiar si hay diferencias estadísticamente significativas entre la media de dos muestras o grupos diferentes de sujetos. Así, desde una perspectiva metodológica experimental, utilizaríamos esta prueba, por ejemplo, cuando queramos comprobar la eficacia de determinado tratamiento, comparando la media en la variable de interés de un grupo de sujetos tratados (grupo experimental), con la media en esta misma variable de otro grupo de sujetos no tratados (grupo control).
En nuestro caso práctico general, podríamos aplicar este contraste si, por ejemplo, quisiéramos estudiar si existen diferencias en el nivel de depresión (variable cuantitativa), en función del género de los ciudadanos (variable cualitativa dicotómica). Así, contrastaríamos la hipótesis de la posible diferencia entre la media en el nivel de depresión (a partir de las puntuaciones en el test B.D.I.) de la muestra de varones con la media de la muestra de mujeres.
2.1.1.Desarrollo de la prueba
De manera esquemática, los pasos que implica este contraste de hipótesis son los siguientes:
1) Hipótesis nula: μ1 = μ2 o bien expresado de modo distinto μ1 − μ2 = 0.
Ésta es la hipótesis nula más habitual y la que consideraremos en este subapartado, pero podría expresarse otra hipótesis nula que fuera: μ1 − μ2 = c, siendo c un determinado valor. Así, podríamos estar interesados en contrastar si la diferencia en el nivel de depresión entre un género y el otro es igual a 5 puntos, por ejemplo. Como este tipo de hipótesis nulas no son las más habituales, no la consideraremos en este subapartado.
2) Hipótesis alternativa:
  • μ1 ≠ μ2 (contraste bilateral).

  • μ1 < μ2 (contraste unilateral izquierdo).

  • μ1 > μ2 (contraste unilateral derecho).

3) Estadístico de contraste:
t = μ 1 μ 2 ( n 1 1 ) s 1 2 + ( n 2 1 ) s 2 2 n 1 + n 2 2 1 n 1 + 1 n 2
donde el numerador es la diferencia entre las dos medias y el denominador es el error estándar (error tipo) de esta diferencia. Este error tipo es igual a la desviación estándar común (primer término del denominador), dividido por la raíz cuadrada del tamaño muestral conjunto (n1 + n2) o, lo que es lo mismo, multiplicado por la raíz cuadrada de 1 partido por un tamaño muestral (n1) más 1 partido por el otro tamaño muestral (n2) (que es el segundo término del denominador).
Para poder estimar este error estándar de las diferencias tal como lo hemos hecho, hemos de haber partido previamente de unas suposiciones. En primer lugar (y de hecho como ya lo habíamos supuesto en los contrastes anteriores), deberemos suponer que las observaciones provienen de una población normal, o bien necesitamos muestras grandes en cada grupo de manera que pueda aplicarse el teorema del límite central. En segundo lugar, debemos suponer que las desviaciones estándar son idénticas en las dos poblaciones (σ1 = σ2). Ello nos permite estimar la desviación estándar común como lo estamos haciendo (con el primer término del denominador). De no cumplirse estas suposiciones, tendríamos una prueba sesgada porque dicha estimación estaría sesgada.
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
El estadístico de contraste t se distribuye según una t de Student con n1 + n2 − 2 grados de libertad.
Para un contraste bilateral tendremos dos valores críticos (superior e inferior). Dichos valores críticos dependerán del nivel de significación asumido y del número de grados de libertad. Entre estos dos valores críticos tendremos la región de aceptación de la hipótesis nula. Por encima del valor superior y por debajo del inferior, la región de rechazo de la hipótesis nula, y aceptación de la alternativa:
a) Contraste bilateral:
  • Aceptación hipótesis nula: t n 1 + n 2 2 , α / 2 < t observado < t n 1 + n 2 2,1 α / 2 .

  • Rechazo de la hipótesis nula: t n 1 + n 2 2 , α / 2 t observado t n 1 + n 2 2,1 α / 2 .

b) Para un contraste unilateral sólo tendremos un valor crítico:
  • Unilateral izquierdo:

    • Aceptación de la hipótesis nula: t n 1 + n 2 2 , α < t observado .

    • Rechazo de la hipótesis nula: t observado t n 1 + n 2 2 , α .

  • Unilateral derecho:

    • Aceptación de la hipótesis nula: t n 1 + n 2 2,1 α > t observado .

    • Rechazo de la hipótesis nula: t observado t n 1 + n 2 2,1 α .

5) Si efectuamos una prueba de significación, directamente buscamos la probabilidad del t observado (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Tomamos la decisión en función de las reglas anteriores.
7) Interpretamos el resultado.
2.1.2.Esquema de la prueba
1) Hipótesis nula: μ1 = μ2 o bien expresado de modo distinto μ1 − μ2 = 0.
2) Hipótesis alternativa:
  • μ1 ≠ μ2 (contraste bilateral).

  • μ1 < μ2 (contraste unilateral izquierdo).

  • μ1 > μ2 (contraste unilateral derecho).

3) Estadístico de contraste:
t = μ 1 μ 2 ( n 1 1 ) s 1 2 + ( n 2 1 ) s 2 2 n 1 + n 2 2 1 n 1 + 1 n 2
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula:
a) Contraste bilateral:
  • Aceptación de la hipótesis nula: t n 1 + n 2 2 , α / 2 < t observado < t n 1 + n 2 2,1 α / 2 .

  • Rechazo de la hipótesis nula: t n 1 + n 2 2 , α / 2 t observado t n 1 + n 2 2,1 α / 2 .

b) Contraste unilateral izquierdo:
  • Aceptación de la hipótesis nula: t n 1 + n 2 2 , α < t observado .

  • Rechazo de la hipótesis nula: t observado t n 1 + n 2 2 , α .

c) Contraste unilateral derecho:
  • Aceptación de la hipótesis nula: t n 1 + n 2 2,1 α > t observado .

  • Rechazo de la hipótesis nula: t observado t n 1 + n 2 2,1 α .

5) Si realizamos una prueba de significación, directamente buscamos la probabilidad del t observado (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Tomamos la decisión en función de las reglas anteriores.
7) Interpretamos el resultado.
Intervalo de confianza para la diferencia entre dos medias en muestras independientes
Al igual que hacíamos para una media, también podemos obtener el intervalo de confianza para la diferencia entre dos medias en muestras independientes.
Intervalo de confianza:
( μ 1 μ 2 ) ± t n 1 + n 2 2 , α ( n 1 1 ) s 1 2 + ( n 2 1 ) s 2 2 n 1 + n 2 2 1 n 1 + 1 n 2
donde t n 1 + n 2 2 , α es el valor de la t de Student con n1 + n2 − 2 grados de libertad, para un α (nivel de significación) determinado, y para una prueba de dos colas.
2.1.3.Ejemplo de contraste para dos medias en muestras independientes
Al empezar el apartado del contraste de hipótesis, planteábamos una serie de preguntas que requerían la aplicación de esta prueba para su resolución. Una de estas preguntas era ¿podemos tratar de averiguar si existen diferencias en el nivel de depresión de los sujetos de este municipio en función de ser de uno u otro género, refiriéndonos a los habitantes del municipio de nuestro ejemplo práctico general? Pues bien, ahora ya podemos tratar de responder a esta cuestión, planteando un contraste de hipótesis para dos medias (las dos medias en depresión medida por el B.D.I.) en muestras independientes (el grupo de varones (v) y el grupo de mujeres (m) (podemos asumir un nivel de significación de 0,05).
Veamos cómo efectuaríamos este contraste o prueba estadística, planteando todos los pasos necesarios:
1) Hipótesis nula: μv = μm o bien expresado de modo distinto μv − μm = 0.
2) Hipótesis alternativa: μv ≠ μm (contraste bilateral).
3) Estadístico de contraste:
t = μ v μ m ( n 1 1 ) s v 2 + ( n 2 1 ) s m 2 n 1 + n 2 2 1 n 1 + 1 n 2
necesitamos calcular las medias aritméticas y las varianzas de la variable B.D.I. para el grupo de hombres (n = 40) y para el grupo de mujeres (n = 60):
μ v = 16,075       s v 2 = 198,533       s m 2 = 220,966
t = μ v μ m ( n 1 1 ) s v 2 + ( n 2 1 ) s m 2 n 1 + n 2 2 1 n 1 + 1 n 2 = 16,075 21,183 39 × 198,533 + 59 × 220,966 98 1 40 + 1 60 = 1,719
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula:
Buscamos en la tabla de la distribución t (tabla 5 de las tablas estadísticas del módulo «Anexo») o con la función «DISTR.T.INV» de Excel los valores críticos de la t de Student para 98 grados de libertad (en la tabla el valor más próximo es para 100 grados de libertad), y un nivel de significació α de 0,05 para prueba de dos colas (contraste bilateral); este valor es de 1,98 (de hecho, ya sabemos que es ±1,98)
a) Región de aceptación hipótesis nula: −1,98 < tobservado < 1,98.
b) Rechazo de la hipótesis nula: −1,98 ≥ tobservado ≥ 1,98.
5) Si realizamos una prueba de significación, directamente buscamos la probabilidad del t observado (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
Podemos obtener el valor de p con la función «DISTR.T» de Excel. Este valor es de 0,089.
6) Tomamos la decisión en función de las reglas anteriores.
Aceptamos la hipótesis nula, ya que −1,719 es mayor que −1,98 (por lo tanto, cae dentro de la región de aceptación de hipótesis nula). O también, porque 0,089 es mayor que 0,05 (es decir, que el valor p es mayor que el nivel de significación, lo que significa que la probabilidad de que sea cierta la hipótesis nula es mayor que el riesgo que hemos asumido para rechazarla y, por lo tanto, no podemos rechazarla).
7) Interpretamos el resultado.
Según los datos de la muestra de 100 sujetos del municipio estudiado, hemos de concluir que nada se opone a aceptar (con un nivel de significación de 0,05) que el nivel medio de depresión de los hombres y las mujeres es igual (no hay diferencias en el nivel medio de depresión entre hombres y mujeres).
También podemos obtener el intervalo de confianza para la diferencia entre las dos medias.
Intervalo de confianza:
μ 1 μ 2 ) ± t n 1 + n 2 2 , α ( n 1 1 ) s 1 2 + ( n 2 1 ) s 2 2 n 1 + n 2 2 1 n 1 + 1 n 2
( 16,075 21,183 ) ± 1,984 39 × 198,533 + 59 × 220,966 98 1 40 + 1 60
( 5,108 ) ± 5,897 11,005 μ 1 μ 2 0,789
Dicho de otro modo, el intervalo de confianza para la diferencia entre las dos medias va de −11,005 a 0,789, y como este intervalo contiene el valor cero (diferencia de 0) podíamos haber aceptado la hipótesis nula de que no existe diferencia en la media de depresión entre los dos grupos (varones y mujeres). Como vemos, este resultado es equivalente al del contraste de hipótesis correspondiente.

2.2.Contraste para dos proporciones en muestras independientes

En este subapartado veremos el contraste de dos proporciones en muestras independientes. Utilizaremos este contraste cuando queramos comprobar o estudiar si existen diferencias estadísticamente significativas entre la proporción de determinada característica en dos muestras o grupos diferentes de sujetos. Deberíamos aplicar este contraste si quisiéramos estudiar, por ejemplo, la eficacia de dos tratamientos distintos, comparando la proporción de sujetos curados en cada uno de los dos grupos tratados. Así, tendríamos la proporción de sujetos curados con el tratamiento 1 (proporción 1) y la proporción de sujetos curados con el tratamiento 2 (proporción 2). El presente contraste nos permitiría comprobar si hay diferencias significativas entre estas dos proporciones y, en consecuencia, si un tratamiento es más eficaz que el otro.
En nuestro caso práctico general, podríamos aplicar este contraste si, por ejemplo, quisiéramos estudiar si se dan diferencias en la proporción de sujetos casados (o casadas) en función del género de los ciudadanos. Así, contrastaríamos la hipótesis de la posible diferencia entre la proporción de casados de la muestra de varones con la proporción de casadas en la muestra de mujeres.
2.2.1.Desarrollo de la prueba: contraste para dos proporciones en muestras independientes
Los pasos que implica este contraste de hipótesis son los siguientes:
1) Hipótesis nula: P1 = P2.
Ésta es la hipótesis nula más habitual, y la que consideraremos en este subapartado, pero podría expresarse otra hipótesis nula que fuera: P1P2 = λ, siendo λ una determinada proporción. Así, podríamos estar interesados en contrastar si la diferencia en el porcentaje de curación entre un tratamiento y el otro es igual a un 20 %. Como este tipo de hipótesis nulas no son las más habituales, no la consideraremos en este subapartado.
2) Hipótesis alternativa:
  • P1P2 (contraste bilateral).

  • P1 < P2 (contraste unilateral izquierdo).

  • P1 > P2 (contraste unilateral derecho).

3) Estadístico de contraste:
z = P 1 P 2 p ( 1 P ) 1 n 1 + 1 n 2
donde:
p = n 1 P 1 + n 2 P 2 n 1 + n 2
En esta fórmula, el numerador es la diferencia entre las dos proporciones y el denominador es el error estándar (error tipo) de esta diferencia. Este error tipo es igual a la raíz cuadrada de P (proporción total) por 1 − P (complementario), dividido por el tamaño muestral conjunto (n1 + n2) o, lo que es lo mismo, multiplicado por 1 partido por un tamaño muestral (n1) más 1 partido por el otro tamaño muestral (n2).
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
El estadístico de contraste z se distribuye según la distribución normal, pero sólo para tamaños muestrales grandes (n1 ≥ 30 y n2 ≥ 30). De hecho, esta prueba no tendría mucho sentido para tamaños muestrales menores, ya que los porcentajes serían difícilmente válidos.
Para un contraste bilateral tendremos dos valores críticos (superior e inferior). Dichos valores críticos dependerán del nivel de significación asumido. Entre estos dos valores críticos tendremos la región de aceptación de la hipótesis nula. Por encima del valor superior y por debajo del inferior, la región de rechazo de la hipótesis nula, y aceptación de la alternativa.
Contraste bilateral:
  • Aceptación de la hipótesis nula: zα/2 < zobservada < z1−α/2.

  • Rechazo de la hipótesis nula: zα/2zobservadaz1−α/2.

Para un contraste unilateral sólo tendremos un valor crítico.
a) Unilateral izquierdo:
  • Aceptación de la hipótesis nula: zα < zobservada.

  • Rechazo de la hipótesis nula: zobservadazα.

b) Unilateral derecho:
  • Aceptación de la hipótesis nula: z1−α > zobservada.

  • Rechazo de la hipótesis nula: zobservadaz1−α.

5) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la z observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Tomamos la decisión en función de las reglas anteriores.
7) Interpretamos el resultado.
2.2.2.Esquema de la prueba: contraste para dos proporciones en muestras independientes
1) Hipótesis nula: P1 = P2 o bien expresado de modo distinto P1P2 = 0.
2) Hipótesis alternativa:
  • P1 = P2 (contraste bilateral).

  • P1 < P2 (contraste unilateral izquierdo).

  • P1 > P2 (contraste unilateral derecho).

3) Estadístico de contraste:
z = P 1 P 2 p ( 1 P ) 1 n 1 + 1 n 2
donde:
p = n 1 P 1 + n 2 P 2 n 1 + n 2
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
a) Contraste bilateral:
  • Aceptación de la hipótesis nula: zα/2 < zobservada < z1−α/2.

  • Rechazo de la hipótesis nula: zα/2zobservadaz1−α/2.

b) Contraste unilateral izquierdo:
  • Aceptación de la hipótesis nula: zα < zobservada.

  • Rechazo de la hipótesis nula: zobservadazα.

c) Contraste unilateral derecho:
  • Aceptación de la hipótesis nula: z1−α > zobservada.

  • Rechazo de la hipótesis nula: zobservadaz1−α.

5) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la z observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Tomamos la decisión en función de las reglas anteriores.
7) Interpretamos el resultado.
Intervalo de confianza para la diferencia entre dos proporciones en muestras independientes
Al igual que hacíamos para dos medias, también podemos obtener el intervalo de confianza para la diferencia entre dos proporciones en muestras independientes.
Intervalo de confianza:
( P 1 P 2 ) ± z α P ( 1 P ) 1 n 1 + 1 n 2
donde:
P = n 1 P 1 + n 2 P 2 n 1 + n 2
y zα es el valor de la distribución normal, para un alfa (nivel de significación) determinado y para una prueba de dos colas.
2.2.3.Ejemplo de contraste para dos proporciones en muestras independientes
Podemos plantearnos la pregunta de si, en el municipio de nuestro ejemplo práctico general, la proporción de sujetos solteros es igual para los dos sexos. Es decir, si hay igual proporción de varones solteros que de mujeres solteras.
Para responder a esta cuestión, hemos de plantear un contraste de hipótesis para dos proporciones en muestras independientes, proporción de varones solteros (Pv) y proporción de mujeres solteras (Pm) (podemos asumir un nivel de significación de 0,05).
Veamos cómo realizaríamos este contraste o prueba estadística, planteando todos los pasos necesarios.
1) Hipótesis nula: Pv = Pm o bien expresado de modo distinto PvPm = 0.
2) Hipótesis alternativa: PvPm (contraste bilateral).
3) Estadístico de contraste:
z = P v P m p ( 1 P ) 1 n v + 1 n m
donde:
P = n v P v + n m P m n v + n m
necesitamos calcular la proporción de varones solteros (nv = 40) y la proporción de mujeres solteras (nm = 60): Pv = 13/40 = 0,325 y Pm = 17/60 = 0,283:
P = n v P v + n m P m n v + n m = 40 × 0,325 + 60 × 0,283 100 = 0,30
que es la proporción total de sujetos solteros.
z = P v P m p ( 1 P ) 1 n v + 1 n m = 0,325 0,283 0,3 × 0,7 1 40 + 1 60 = 0,449
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
El estadístico de contraste se distribuye según la distribución normal. Así, buscamos en la tabla de la distribución normal (tabla 3 de las tablas estadísticas del módulo «Anexo») o mediante la función «DISTR.NORM.ESTAND.INV» de Excel los valores críticos de la z para un nivel de significació α de 0,05 para prueba de dos colas (contraste bilateral); este valor es de 1,96 (de hecho, sabemos que es ±1,96).
a) Región de aceptación hipótesis nula: −1,96 < zobservada < 1,96.
b) Rechazo de la hipótesis nula: −1,96 ≥ zobservada ≥ 1,96.
5) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la z observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Podemos obtener el valor de p con la función de Excel. «DISTR.NORM.ESTAND». Como podemos comprobar, este valor es de 0,673.
7) Tomamos la decisión en función de las reglas anteriores.
Aceptamos la hipótesis nula, ya que 0,449 es menor que 1,96 (por lo tanto, cae dentro de la región de aceptación de hipótesis nula). O también porque 0,673 es mayor que 0,05 (o sea que el valor p es mayor que el nivel de significación, lo que significa que la probabilidad de que sea cierta la hipótesis nula es mayor que el riesgo que hemos asumido para rechazarla y, por lo tanto, no podemos rechazarla).
8) Interpretamos el resultado.
Según los datos de la muestra de 100 sujetos del municipio estudiado, hemos de concluir que nada se opone a aceptar (con un nivel de significación de 0,05) que la proporción de varones solteros es igual a la proporción de mujeres solteras.
También podemos obtener el intervalo de confianza para la diferencia entre las dos medias.
Intervalo de confianza:
( P v P m ) ± z α p ( 1 P ) 1 n 1 + 1 n 2
( 0,325 0,283 ) ± 1,96 0,3 × 0,7 1 40 + 1 60 0,042 ± 0,183
−0,141 ≤ PvPm ≤ 0,225
Dicho de otro modo, el intervalo de confianza para la diferencia entre las dos proporciones va de −0,141 a 0,225, y como este intervalo contiene el valor cero (diferencia de 0) podíamos haber aceptado la hipótesis nula de que no hay diferencia entre la proporción de varones solteros y la de mujeres solteras. Como vemos, este resultado es equivalente al del contraste de hipótesis correspondiente.

2.3.Contraste para dos varianzas en muestras independientes

Hemos visto que distintos problemas de investigación pueden versar sobre diferencias en la media o en la proporción de dos muestras independientes, pero puede también suceder que el interés se centre en comprobar si una muestra de sujetos muestra mayor o menor variabilidad en alguna conducta relevante que otra muestra. Así, podríamos estar interesados en comprobar si la variabilidad en depresión es igual o no en la muestra de varones que en la de mujeres. Por otro lado, también podemos estar interesados en comparar la variabilidad entre dos distribuciones de datos para comprobar el cumplimiento de algún supuesto estadístico. De este modo, en el contraste de dos medias en muestras independientes mediante el estadístico t hacíamos el supuesto, tal como aplicamos la prueba, de que la variabilidad en ambas muestras era la misma (supuesto de igualdad u homogeneidad de varianzas). Para todos estos casos, el contraste de hipótesis que debemos aplicar es el de comparación de dos varianzas en muestras independientes.
2.3.1.Desarrollo de la prueba: contraste para dos varianzas en muestras independientes
Los pasos que implica este contraste de hipótesis son los siguientes:
1) Hipótesis nula: σ 1 2 = σ 2 2 o también σ 1 2 σ 2 2 = 1 .
Esta hipótesis nula nos dice que las dos varianzas (las varianzas de las dos poblaciones) son iguales.
2) Hipótesis alternativa: σ 1 2 σ 2 2 o también σ 1 2 σ 2 2 1 .
En esta prueba no suelen considerarse los posibles contrastes unilaterales, ya que son muy poco habituales.
3) Estadístico de contraste:
f = s 1 2 s 2 2
El estadístico de contraste es una f de Snedecor que se obtiene dividiendo las dos varianzas. El criterio habitual es considerar la varianza mayor como la del numerador y la menor como la del denominador. Ello permite obtener siempre un valor de f superior a 1.
4) Valor crítico de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
El estadístico de contraste f se distribuye según una distribución f de Snedecor con n1 − 1 grados de libertad en el numerador, y n2 − 1 grados de libertad en el denominador.
Criterios para determinar las regiones de aceptación y rechazo de la hipótesis nula:
  • Aceptación de la hipótesis nula: f observada < f n 1 1 , n 2 1 , α .

  • Rechazo de la hipótesis nula: f observada f n 1 1 , n 2 1 , α .

5) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la f observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula, y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Tomamos la decisión en función de las reglas anteriores.
7) Interpretamos el resultado.
2.3.2.Esquema de la prueba: contraste para dos varianzas en muestras independientes
1) Hipótesis nula: σ 1 2 = σ 2 2 o también σ 1 2 σ 2 2 = 1 .
2) Hipótesis alternativa: σ 1 2 σ 2 2 o también σ 1 2 σ 2 2 1 .
3) Estadístico de contraste:
f = s 1 2 s 2 2
El estadístico de contraste f se distribuye según una distribución f de Snedecor con n1 − 1 grados de libertad en el numerador y n2 − 1 grados de libertad en el denominador.
4) Valor crítico de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
  • Aceptación de la hipótesis nula: f observada < f n 1 1 , n 2 1 , α .

  • Rechazo de la hipótesis nula: f observada f n 1 1 , n 2 1 , α .

5) Si efectuamos una prueba de significación, directamente buscamos la probabilidad de la f observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Tomamos la decisión en función de las reglas anteriores.
7) Interpretamos el resultado.
2.3.3.Ejemplo de contraste para dos varianzas en muestras independientes
Podemos plantearnos la pregunta de si, en el municipio de nuestro ejemplo práctico general, la variabilidad en ansiedad es igual para los dos sexos. Es decir, si hay igual varianza en el test M.A.S para los varones que para las mujeres.
Para responder a esta cuestión, hemos de plantear un contraste de hipótesis para dos varianzas en muestras independientes (podemos asumir un nivel de significación de 0,05). Comparamos la varianza en el M.A.S. de los varones ( σ v 2 ) , con la de las mujeres ( σ m 2 ) .
Veamos cómo llevaríamos a cabo este contraste o prueba estadística, planteando todos los pasos necesarios.
1) Hipótesis nula: σ v 2 = σ m 2 .
2) Hipótesis alternativa: σ v 2 σ m 2 .
3) Estadístico de contraste:
f = s 1 2 s 2 2
necesitamos calcular la varianza en el M.A.S. de los varones ( σ v 2 = 167,558 ) y la varianza en el M.A.S. para las mujeres ( σ m 2 = 134,774 ) . Como la varianza en el grupo de varones es mayor que en el de las mujeres, colocamos la varianza de los varones en el numerador:
f = s 1 2 s 2 2 = 167,558 134,774 = 1,243
4) Valores críticos de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
Hemos de obtener en las tablas de la distribución f (tabla 6 de las tablas estadísticas del anexo) o mediante la función «DISTR.F.INV» de Excel el valor crítico para 39 grados de libertad en el numerador (n1 − 1) y 59 grados de libertad para el denominador (n2 − 1), con un nivel de significación de 0,05. En las tablas, el valor más aproximado se da con 40 y 60 grados de libertad. Este valor es de 1,59.
Con Excel, con 39 y 59 grados de libertad, obtendríamos el valor de 1,60.
  • Región de aceptación de la hipótesis nula: 1,60 > fobservada.

  • Región de rechazo de la hipótesis nula: fobservada ≥ 1,60.

5) Si hacemos una prueba de significación, directamente buscamos la probabilidad de la z observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
Podemos obtener el valor de p con la función de Excel «DISTR.F». Como podemos comprobar, para una f = 1,243, con 39 y 59 grados de libertad, este valor de p es de 0,222.
6) Tomamos la decisión en función de las reglas anteriores.
Aceptamos la hipótesis nula, ya que 1,243 es menor que 1,59 (por lo tanto, cae dentro de la región de aceptación de hipótesis nula). O también porque 0,222 es mayor que 0,05 (es decir, el valor p es mayor que el nivel de significación, lo que significa que la probabilidad de que sea cierta la hipótesis nula es mayor que el riesgo que hemos asumido para rechazarla y, por lo tanto, no podemos rechazarla).
7) Interpretamos el resultado.
Según los datos de la muestra de 100 sujetos del municipio estudiado, hemos de concluir que nada se opone a aceptar (con un nivel de significación de 0,05) que la variabilidad en ansiedad de los varones es igual a la de las mujeres.

3.Contraste para las medias de más dos muestras independientes

Cuando queremos comparar las medias de más de dos grupos de sujetos distintos, hemos de aplicar la prueba estadística denominada análisis de varianza (en adelante ANOVA). Este contraste de hipótesis se utiliza habitualmente en muchos diseños de investigación, especialmente en los experimentales, en los que se quiere comprobar la eficacia o el efecto de distintos tratamientos o niveles de una variable independiente, sobre la variable dependiente, que se corresponde generalmente con alguna medida de la conducta de los sujetos. En este apartado sólo trataremos esta prueba de manera introductoria y, por lo tanto, sólo presentaremos el caso más simple que corresponde a una única variable independiente; no obstante, esta prueba se puede extender al análisis de los efectos de más de una variable independiente (los denominados diseños factoriales) o a aquellos diseños en los que se aplican los diferentes niveles de la variable independiente a un único grupo de sujetos (diseños intra sujetos).
El ANOVA analiza la variabilidad (o varianza) de los datos, descomponiendo esta variabilidad (varianza total) en aquella que se da entre las medias de los grupos (varianza entre grupos) y aquella que se produce dentro de cada grupo (varianza intra grupos). El cociente este estas dos varianzas se distribuye según una f de Snedecor.
Para desarrollar esta prueba seguiremos el mismo esquema que en los contrastes anteriores, planteando las diferentes fases que supone.

3.1.Desarrollo del ANOVA

De modo esquemático, los pasos que supone este contraste de hipótesis son los siguientes:
1) Hipótesis nula: μ1 = μ2 = ... = μk.
Esta hipótesis nula representa la igualdad entre las medias de los diferentes grupos estudiados (hasta k grupos).
2) Hipótesis alternativa: μi ≠ μj al menos para algún par de grupos i, j.
La hipótesis alternativa supone que al menos hay diferencia entre las medias de dos de los grupos estudiados, aunque esta diferencia podría darse entre más de dos medias. El ANOVA sólo puede comprobar si existen diferencias estadísticamente significativas entre al menos dos grupos, pero no nos proporciona información sobre entre qué grupos o medias concretas se producen estas diferencias significativas.
3) Estadístico de contraste:
f = M C entre M C intra
donde el numerador es la media cuadrática (MC) o varianza entre las medias de los grupos y el denominador es la media cuadrática o varianza dentro de cada grupo.
Estas medias cuadráticas se obtienen dividiendo las sumas de cuadrados (SC) tanto entre grupos como intra grupos por sus respectivos grados de libertad (df). Así:
M C entre = S C entre d f entre       M C intra = S C intra d f intra
Las sumas de cuadrados tanto la entre grupos como la intra grupos como la total, que sería la suma de las dos anteriores, se obtienen con las fórmulas siguientes:
S C total = i j Y i j 2 i j Y i j 2 N
sumamos todas las puntuaciones al cuadrado y restamos la suma de todas ellas elevada al cuadrado dividida por el número de sujetos (o puntuaciones).
S C entre = j i Y i j 2 n j i j Y i j 2 N
Sumamos los totales de cada grupo al cuadrado divididos por el número de sujetos en el grupo, y restamos la suma de todas las puntuaciones al cuadrado dividida por el número total de sujetos.
S C intra = i j Y i j 2 j i Y i j 2 n j ,
o, mucho mas fácilmente: SCintra = SCtotalSCentre, ya que sabemos que la suma de cuadrados total es igual a la suma de cuadrados entre más la suma de cuadrados intra.
Los grados de libertad (df) para cada una de estas fuentes de variación (total, entre e intra) son los siguientes:
  • grados de libertad total = N − 1

  • grados de libertad entre = k − 1

  • grados de libertad intra = Nk

donde N es el número total de sujetos o puntuaciones y k es el número de grupos.
Así, tal como hemos comentado, obtendremos las medias cuadráticas para cada fuente de variación, dividiendo su suma de cuadrados por sus grados de libertad.
Este proceso de la prueba del análisis de varianza se presenta habitualmente en lo que se denomina el cuadro resumen de este análisis de varianza.
4) Valor crítico de la prueba y regiones de aceptación y rechazo de la hipótesis nula.
El estadístico de contraste f se distribuye según una f de Snedecor con k − 1 grados de libertad en el numerador, y N − k grados de libertad en el denominador.
Los valores críticos (o valor crítico, porque de hecho sólo obtenemos uno) de la distribución f se puede obtener en la tabla 6 del módulo «Anexo».
Este valor crítico determina las regiones de aceptación y rechazo de la hipótesis nula:
  • Aceptación de la hipótesis nula: fk−1,Nk > fobservada.

  • Rechazo de la hipótesis nula: fobservadafk−1,Nk.

5) Si realizamos una prueba de significación, directamente buscamos la probabilidad de la f observada (valor p). Si este valor p es mayor que el nivel de significación α, aceptamos la hipótesis nula y si es menor, rechazamos esta hipótesis nula y aceptamos la alternativa.
6) Este proceso de la prueba del análisis de varianza se presenta habitualmente en lo que se denomina el cuadro resumen del ANOVA (tabla 1).
Tabla 1

FV

SC

df

MC

f

p

Entre grupos

j i Y i j 2 n j i j Y i j 2 N

k − 1

S C entre k 1

M C entre M C intra

Intra grupos

i j Y i j 2 j i Y i j 2 n j

Nk

S C intra N k

Total

i j Y i j 2 i j Y i j 2 N

N − 1

7) Tomamos la decisión en función de las reglas anteriores.
8) Interpretamos el resultado.

3.2.Ejemplo de realización del ANOVA

Podemos ilustrar la aplicación del ANOVA siguiendo con nuestro ejemplo práctico general. Podríamos estudiar si existen diferencias en el nivel de depresión (B.D.I.) de los sujetos en función de su estado civil. Así, compararíamos las puntuaciones en depresión de los tres grupos que formaríamos en función del estado civil de los sujetos: solteros o solteras, casados o casadas y otros. De este modo, tendríamos tres grupos (desde una perspectiva experimental no muy adecuada para este caso, tres niveles de la variable independiente). Para simplificar el ejemplo numérico no tendremos en cuenta todos los sujetos de nuestra matriz de datos, sino sólo 30 de los 100 sujetos de la muestra estudiada. Estos 30 sujetos los hemos elegido a partir de los 10 primeros sujetos de nuestra matriz de datos para cada uno de los tres estados civiles (los tres grupos formados). O sea, que haremos el ANOVA con las puntuaciones en depresión (B.D.I.) de los diez primeros sujetos solteros, los diez primeros casados y los diez primeros de otros estados civiles. La matriz de datos correspondiente será la que mostramos en la tabla 2.
Tabla 2

Soltero/a

Casado/a

Otros

0

7

3

8

9

10

7

1

2

5

6

18

9

3

19

4

16

17

3

8

12

12

7

4

1

9

12

14

12

3

63

78

100

∑ 241

En la última fila de esta matriz hemos calculado los totales para cada grupo y en esta última fila a la derecha, el total general (suma de todas las puntuaciones).
A partir de estos datos, para realizar el ANOVA, calcularemos en primer lugar las sumas de cuadrados de las tres fuentes de variación (total, entre e intra):
S C total = i j Y i j 2 i j Y i j 2 N = 8 2 + 7 2 + 5 2 + . . . + 4 2 + 12 2 + 3 2 ( 241 ) 2 30 = 818,967
S C entre = j i Y i j 2 n j i j Y i j 2 N = 63 2 10 + 78 2 10 + 100 2 10 241 2 30 = 69,267
SCintra = SCtotalSCentre = 818,967 − 69,267 = 749,7
Con estos cálculos ya podemos completar el cuadro resumen del ANOVA (tabla 3).
Tabla 3

FV

SC

df

MC

f

p

Entre grupos

69,267

k − 1 = 2

69,267 2 = 34,633

34,633 27,767 = 1,247

0,303

Intra grupos

749,7

Nk = 27

749,7 27 = 27,767

Total

818,967

N − 1 = 29

El valor p del estadístico de contraste lo hemos obtenido con la función «DISTR.F» de Excel y lo hemos incorporado en la última columna de este cuadro resumen.
Para obtener el valor crítico de este estadístico de contraste, utilizamos la función «DISTR.F.INV» de Excel, para una probabilidad de 0,05 (nivel de significació α igual a 0,05), y 2 grados de libertad en el numerador y 27 grados de libertad en el denominador. Este valor crítico es de 3,354.
Decisión: Debemos aceptar la hipótesis nula que planteaba que las tres medias son iguales (μ1 = μ2 = μ3) porque el estadístico de contrastes observado es menor que el valor crítico de la prueba (1,247 < 3,354), o porque el valor p es mayor que el nivel de significación (0,303 > 0,05).
Interpretamos el resultado: Podemos concluir que no existen diferencias significativas en el nivel de depresión de los sujetos en función de su estado civil. Dicho de otro modo, el nivel medio de depresión de los sujetos solteros, casados o de otros estados civiles es el mismo.

3.3.Condiciones de aplicación del ANOVA

Para poder aplicar adecuadamente la prueba del ANOVA, deben cumplirse una serie de requisitos que se concretan en cuatro aspectos: las observaciones deben ser independientes (tal como ya teníamos que asumir en los anteriores contrastes de hipótesis), también ha de cumplirse la normalidad de la distribución de la variable estudiada (se puede comprobar este supuesto con la prueba de Kolmogorov-Smirnov), además, la homogeneidad de varianzas (también denominada homocedasticidad, y que supone que las varianzas de los distintos grupos sean igual) y, finalmente, el supuesto de medida, es decir, que la variable dependiente estudiada esté medida al menos con una escala de intervalo.

4.Contrastes no paramétricos para la comparación de dos o más muestras independientes

En los contrastes vistos hasta este momento, siempre hemos supuesto que se cumplían unos requisitos para su correcta aplicación. Estos requisitos tienen que ver con la forma de la distribución de la variable estudiada (distribución normal), con la escala de medida de dicha variable (al menos de intervalo), con la independencia de las observaciones o algunos más específicos como la homogeneidad de varianzas para el ANOVA. De no cumplirse estas condiciones de aplicación, las pruebas pueden estar sesgadas de manera que sus resultados no serían válidos. Debido a ello, y para poder realizar pruebas estadísticas en aquellos casos en que se incumplan algunos de los requisitos mencionados, se han desarrollado contrastes que no precisan de estas condiciones para su correcta utilización. Estos contraste se denominan no paramétricos, en contraposición a los anteriormente presentados que se incluyen dentro de los llamados contrastes paramétricos. Algunas de las condiciones de aplicación de los contrastes paramétricos (como por ejemplo, la normalidad de las distribuciones) pueden vulnerarse sin que se produzcan sesgos apreciables en los resultados cuando los tamaños muestrales son suficientemente grandes (como consecuencia del teorema del límite central). Por ello, las alternativas no paramétricas a estos contrastes serán especialmente aconsejables cuando tengamos tamaños muestrales reducidos. De todas formas, hay que tener en cuenta que, a igualdad de los demás factores y cumpliéndose las condiciones de aplicación, la prueba paramétrica siempre es más potente (tiene mayor potencia) que su correspondiente alternativa no paramétrica, por lo que, si podemos comprobar el cumplimiento de los supuestos paramétricos, estas pruebas serán de primera elección.
Para los casos de incumplimiento severo de estos requisitos de aplicación cuando comparamos dos o más muestras independientes y, especialmente cuando trabajemos con tamaños muestrales reducidos, se han desarrollado dos pruebas no paramétricas que son, la prueba de Mann-Whitney para el caso de dos muestras independientes, y la prueba de Kruskal-Wallis para más de dos muestras independientes.

4.1.Prueba de Mann-Whitney para dos muestras independientes

La prueba de Mann-Whitney es una excelente alternativa a la prueba de la t de Student sobre la diferencia en la tendencia central de dos muestras independientes cuando no se cumplen los supuestos en los que se basa la prueba t. Esta prueba, como la mayoría de los contrastes no paramétricos, se fundamenta en la obtención de los rangos u órdenes de las puntuaciones de cada muestra. Así, de manera intuitiva podemos imaginarnos que si juntamos las observaciones de dos o más muestras y ordenamos estas puntuaciones (obtenemos sus rangos) y sumamos estos rangos para cada muestra independiente, si estas sumas son muy diferentes, habrá evidencia de que los valores de una muestra son más grandes (o pequeños) que los de otra muestra, mientras que si estas sumas son parecidas, querrá decir que estos valores son semejantes en las dos muestras. Ésta es la lógica que subyace a los contrastes no paramétricos.
4.1.1.Desarrollo de la prueba de Mann-Whitney
1) Hipótesis nula: la tendencia central (o mediana Mdn) de la muestra 1 es igual a la tendencia central (o mediana) de la muestra 2: Mdn1 = Mdn2.
En este caso, no podemos hablar de medias (ya que podríamos aplicar el contraste con una variable medida con una escala ordinal) y comparamos la tendencia central o la mediana de las dos muestras.
2) Hipótesis alternativa: la tendencia central (o mediana) de la muestra 1 es distinta a la tendencia central de la muestra 2 (contraste bilateral): Mdn1Mdn2.
Podemos plantearnos los contrastes unilaterales derecho o izquierdo correspondientes cuando la hipótesis alternativa contemple una diferencia en la tendencia central de una muestra respecto a la otra, en una dirección determinada.
3) Estadístico de contraste: U = ∑ Ri, donde ∑ Ri es el menor valor obtenido al sumar los rangos de las puntuaciones para cada una de las dos muestras.
4) Valor crítico de la prueba.
El estadístico U tiene una distribución propia que se presenta en la tabla 8 bis de las tablas estadísticas del anexo, donde se puede obtener el valor crítico en función de los tamaños muestrales (n1 y n2, siendo n1 la muestra con ∑ Ri menor) y del nivel de significación (α/2 si el contraste es bilateral).
Esta distribución se aproxima a la normal a medida que aumentan los tamaños muestrales, siendo válida la aproximación para tamaños muestrales mayores de 20.
La obtención del valor z correspondiente a esta aproximación a la distribución normal se obtiene aplicando la siguiente fórmula:
z = U n 1 ( N + 1 ) 2 n 1 n 2 ( N + 1 ) 12
5) Decisión: para obtener las regiones de aceptación o rechazo de la hipótesis nula se compara la U observada con el valor crítico. Si la U observada es mayor que el valor crítico, se acepta la hipótesis nula y si es igual o menor, se rechaza dicha hipótesis nula y se acepta la alternativa.
6) Interpretació del resultat.
4.1.2.Ejemplo de realización de la prueba de Mann-Whitney
Podemos ilustrar la aplicación del Mann-Whitney siguiendo con nuestro ejemplo práctico general y con un estudio muy similar a otro desarrollado para el ANOVA, pero analizando la diferencia entre dos grupos en vez de entre tres, como hacíamos entonces. Así, podríamos estudiar si se dan diferencias en el nivel de depresión (B.D.I.) de los sujetos en función estar solteros o casados. Para ello, compararíamos las puntuaciones en depresión de los dos grupos que formaríamos en función del estado civil de los sujetos: solteros o solteras y casados o casadas. Para aplicar la prueba de Mann-Whitney de manera más plausible, podemos suponer que sólo disponemos de 20 sujetos, 10 de cada uno de los dos estados civiles, y que no podemos presuponer que se cumplen los requisitos paramétricos para aplicar la prueba de la t de Student.
Estos 20 sujetos los hemos elegido a partir de los 10 primeros sujetos de nuestra matriz de datos para cada uno de los dos estados civiles (los dos grupos formados). Es decir, que haremos la prueba con las puntuaciones en depresión (B.D.I.) de los diez primeros sujetos solteros o solteras y los diez primeros casados o casadas. La matriz de datos correspondiente será la que mostramos en la tabla 4.
Tabla 4

Soltero/a

Casado/a

0

7

8

9

7

1

5

6

9

3

4

16

3

8

12

7

1

9

14

12

Ahora ya podemos realizar la prueba de Mann-Whitney para estos datos, siguiendo los pasos habituales.
1) Hipótesis nula: la tendencia central (o mediana Mdn) en depresión de los varones es igual a la de las mujeres: Mdnv = Mdnm.
2) Hipótesis alternativa: la tendencia central (o mediana Mdn) en depresión de los varones no es igual a la de las mujeres: MdnvMdnm.
3) Estadístico de contraste: U = ∑ Ri, donde ∑ Ri es el menor valor obtenido al sumar los rangos de las puntuaciones para cada una de las dos muestras.
Para obtener este valor de U, en primer lugar hemos de ordenar todas las puntuaciones de la matriz de datos independientemente de la muestra a la que pertenezcan. Para ello, es más fácil disponer de la matriz de datos en forma de filas y no columnas, como la teníamos (tabla 5)
Tabla 5

Soltero/a

0

8

7

5

9

4

3

12

1

14

Casado/a

7

9

1

6

3

16

8

7

9

12

Ahora, si ordenamos todas las observaciones, tendremos:

0

1

1

3

3

4

5

6

7

7

7

8

8

9

9

9

12

12

14

16

Y si asignamos los rangos a cada puntuación, obtendremos la tabla 6 (cuando hay puntuaciones empatadas, se asignan el mismo rango a todas ellas. Este rango es el promedio de los órdenes que ocupan estas distintas puntuaciones empatadas).
Tabla 6

Puntuación

0

1

1

3

3

4

5

6

7

7

7

8

8

9

9

9

12

12

14

16

Rango

1

2,5

2,5

4,5

4,5

6

7

8

10

10

10

12,5

12,5

15

15

15

17,5

17,5

19

20

Una vez tenemos el rango de cada puntuación, podemos sustituirlas por sus rangos en la matriz original y sumar estos rangos para cada grupo (tabla 7).
Tabla 7

Soltero/a

1

12,5

10

7

15

6

4,5

17,5

2,5

19

∑ 95

Casado/a

10

15

2,5

8

4,5

20

12,5

10

15

17,5

∑ 115

Pensemos que la suma de todos los rangos debe ser igual a:
N ( N + 1 ) 2
En nuestro ejemplo, podemos comprobar que 95 +115 es igual a:
20 ( 20 + 1 ) 2 = 210
Así, el valor de U es de 95 (el menor valor encontrado de la suma de rangos de cada una de las dos muestras): U = ∑ Ri = 95.
4) Valor crítico de la prueba.
Para obtener el valor crítico de la prueba de Mann-Whitney debemos consultar la tabla 8 bis de las tablas estadísticas del módulo «Anexo». En este caso, buscaremos el valor de U que corresponde a un n1 igual a 10, un n2 también igual a 10 y un α de 0,05 (aunque en las tablas hay que buscar α/2, o sea 0,025).
Así:
U n 1 = 10 , n 2 = 10 , α / 2 = 0,025 = 79
5) Decisión: aceptamos la hipótesis nula porque el valor de la U observada (95) es mayor que el valor crítico para esta prueba (79).
6) Interpretación: podemos concluir que no hay diferencias significativas entre el nivel medio en depresión de los sujetos solteros o solteras y los sujetos casados o casadas.

4.2.Prueba de Kruskal-Wallis para más dos muestras independientes

La prueba de Mann-Whitney para dos muestras independientes presentada anteriormente fue generalizada a más de dos muestras por Kruskal y Wallis. Las ventajas de esta prueba frente al ANOVA es que no requiere para su aplicación que se cumplan los requisitos del ANOVA, sobre la normalidad de la distribución de la variable estudiada ni sobre el cumplimiento de la homocedasticidad, y permita trabajar con variables dependientes medidas en escalas ordinales.
4.2.1.Desarrollo de la prueba de Kruskal-Wallis
1) Hipótesis nula: las tendencias centrales (o mediana Mdn) e las distintas muestras estudiadas son iguales: Mdn1 = Mdn2 = ... = Mdnk.
En este caso, no podemos hablar de medias (ya que podríamos aplicar el contraste con una variable medida con una escala ordinal) y comparamos la tendencia central o la mediana de las dos muestras.
2) Hipótesis alternativa: la tendencia central (o mediana) de al menos una de las muestras es distinta a la tendencia central de las demás: MdniMdnj, al menos para una muestra i y una j.
3) Estadístico de contraste:
H = 12 N ( N + 1 ) i = 1 k R i 2 n i 3 ( N + 1 ) ,
donde k es el número de muestras y ∑ Ri es la suma de los rangos de la muestra i, tras realizar una ordenación única de todas las muestras, N es el número total de observaciones y ni el número total de observaciones de la muestra i.
Corrección por empates: si hay puntuaciones empatadas (con igual rango), debe realizarse la siguiente corrección del valor de H.
H * = H 1 j = 1 r t j 3 t j N 3 N ,
donde r es el número de grupos empatados y t es el número de puntuaciones empatadas en un grupo de observaciones en el que existen empates.
4) Valor crítico de la prueba.
El estadístico H tiene una distribución propia que se presenta en la tabla 9 de las tablas estadísticas del módulo «Anexo», donde se puede obtener el valor crítico en función de los tamaños muestrales (n1, n2 y n3) y del nivel de significación α.
A medida que aumenta el número de muestras (>3) y/o el número de observaciones en alguna de ellas es superior a 5, la distribución de H se aproxima a una Chi cuadrado (χ2) con k − 1 grados de libertad, siendo k el número de muestras.
5) Decisión: para obtener las regiones de aceptación o rechazo de la hipótesis nula se compara la H observada con el valor crítico. Si la H observada (o el χ2) es menor que el valor crítico, se acepta la hipótesis nula y si es igual o mayor, se rechaza dicha hipótesis nula y se acepta la alternativa.
6) Interpretació del resultat.
4.2.2.Ejemplo de realización de la prueba de Kruskal-Wallis
Podemos ilustrar la aplicación de la prueba de Kruskal-Wallis siguiendo con nuestro ejemplo práctico general. Así, seguiremos con el mismo estudio que propusimos para aplicar el ANOVA. En aquel caso, analizábamos si existen diferencias en el nivel de depresión (B.D.I.) de los sujetos en función de su estado civil, pero sólo utilizábamos (por cuestión práctica de cálculos) los 10 primeros sujetos de cada grupo. Ahora, aún reduciremos más los tamaños muestrales y supondremos que sólo disponemos de los cinco primeros sujetos de cada grupo y que no podemos afirmar que se cumplen los supuestos más restrictivos del ANOVA. Así, la matriz de datos correspondiente será la que mostramos en la tabla 8.
Tabla 8

Soltero/a

Casado/a

Otros

0

7

3

8

9

10

7

1

2

5

6

18

9

3

19

1) Hipótesis nula: la tendencia central (o mediana Mdn) en depresión de los tres grupos o estados civiles es igual: Mdns = Mdnc = Mdno.
2) Hipótesis alternativa: la tendencia central (o mediana Mdn) en depresión de al menos uno de los grupos o estado civil es diferente que la de al menos uno de los otros dos estados civiles: MdniMdnj, al menos para una i y j.
3) Estadístico de contraste:
H = 12 N ( N + 1 ) i = 1 k R i 2 n i 3 ( N + 1 ) ,
donde k es el número de muestras y ∑ Ri es la suma de los rangos de la muestra i, tras realizar una ordenación única de todas las muestras.
Corrección por empates: si hay puntuaciones empatadas (con igual rango), ha de realizarse la siguiente corrección del valor de H.
H * = H 1 j = 1 r t j 3 t j N 3 N ,
donde r es el número de grupos empatados y t es el número de puntuaciones empatadas en un grupo de observaciones en el que existen empates.
Para obtener este valor de H, en primer lugar hemos de ordenar todas las puntuaciones de la matriz de datos independientemente de la muestra a la que pertenezcan. Para ello, es más fácil disponer de la matriz de datos en forma de filas y no de columnas, como la teníamos (tabla 9).
Tabla 9

Soltero/a

0

8

7

5

9

Casado/a

7

9

1

6

3

Otros

3

10

2

18

19

Ahora si ordenamos todas las observaciones, tendremos:

0

1

2

3

3

5

6

7

7

8

9

9

10

18

19

Y si asignamos los rangos a cada puntuación, obtendremos la tabla 10 (cuando hay puntuaciones empatadas, se asignan el mismo rango a todas ellas. Este rango es el promedio de los órdenes que ocupan estas distintas puntuaciones empatadas).
Tabla 10

Puntuación

0

1

2

3

3

5

6

7

7

8

9

9

10

18

19

Rango

1

2

3

4,5

4,5

6

7

8,5

8,5

10

11,5

11,5

13

14

15

Una vez tenemos el rango de cada puntuación, podemos sustituirlas por sus rangos en la matriz original y sumar estos rangos para cada grupo (tabla 11).
Tabla 11

Soltero/a

1

10

8,5

6

11,5

∑ 37

Casado/a

8,5

11,5

2

7

4,5

∑ 33,5

Otros

4,5

13

3

14

15

∑ 49,5

Pensemos en que la suma de todos los rangos debe ser igual a:
N ( N + 1 ) 2
En nuestro ejemplo, podemos comprobar que 37 + 33,5 + 49,5 es igual a:
15 ( 15 + 1 ) 2 = 120
Con estos datos ya podemos calcular el valor de H:
H = 12 N ( N + 1 ) i = 1 k R i 2 n i 3 ( N + 1 ) = 12 15 × 16 37 2 5 + 33,5 2 5 + 49,5 2 5 3 × 16 = 1,415
Corrección por empates:
H = H 1 j = 1 r t j 3 t j N 3 N = 1,415 1 ( 2 3 2 ) + ( 2 3 2 ) + ( 2 3 2 ) 15 3 15 = 1,423
4) Valor crítico de la prueba.
El estadístico H tiene una distribución propia que se presenta en la tabla 9 de las tablas estadísticas del módulo «Anexo», donde se puede obtener el valor crítico en función de los tamaños muestrales (n1, n2 y n3) y del nivel de significació α.
Así, para este caso:
H n 1 = 5 , n 2 = 5 , n 3 = 5 , α = 0,049 = 5,78
5) Decisión: aceptamos la hipótesis nula porque el valor de la H observada (1,423) es menor que el valor crítico (5,78).
6) Interpretación: debemos concluir que nada se opone a aceptar que no hay diferencias en el nivel medio de depresión de los sujetos en función de su estado civil (nivel de significación de 0,05).

5.Contrastes de hipótesis mediante Excel

5.1.Contraste para dos medias en muestras independientes

Podemos realizar la prueba anterior, siguiendo el mismo ejemplo, utilizando Excel. La manera más rápida de llevarla a cabo es utilizando los programas preconfigurados del menú Herramientas.
Como utilizamos para ilustrar la prueba el ejemplo anterior de la posible diferencia en el nivel medio de depresión entre hombres y mujeres, hemos aislado de nuestra matriz de datos general estas dos variables. Para agrupar por un lado los hombres y por otro las mujeres, podemos ordenar los sujetos en función de su valor en la variable sexo, con lo cual tendremos los hombres en primer lugar y luego todas las mujeres. Para ordenar todos los sujetos según este criterio, seguimos la secuencia de instrucciones siguiente: Datos → Ordenar → y en el cuadro de diálogo, entramos: Ordenar por Sexo, y activamos Ascendente (si no está ya activado). Una vez agrupados primero los varones y luego las mujeres, ya podemos utilizar el programa preconfigurado para la comparación de dos medias en muestras independientes.
Para usar esta opción debemos seguir la secuencia de opciones de menú siguiente: Herramientas → Análisis de Datos → Prueba t para dos muestras suponiendo varianzas iguales.
Utilizamos esta opción (y no otra posible, que es cuando las dos muestras tienen varianzas desiguales) porque ya dijimos que suponemos que las dos muestras tienen igual varianza (aunque ya veremos más adelante que también podemos comprobar este supuesto).
Debemos cumplimentar el cuadro de diálogo de dicha prueba como muestra la figura 1.
Como vemos en este cuadro de diálogo, hemos introducido el rango de entrada de los valores de las dos variables (B.D.I. para varones [variable 1]) y B.D.I. para mujeres [variable 2]). En diferencia hipotética entre las medias no introducimos ningún valor porque nuestra hipótesis nula es que esta diferencia es cero (ya vimos que podíamos plantearnos una hipótesis nula sobre un valor de diferencia determinado c). El nivel de significación (alfa) que nos da por defecto es el de 0,05, pero podemos modificar este valor si queremos. Finalmente, como siempre, le pedimos que nos dé los resultados en una hoja nueva.
Si aceptamos, Excel nos proporciona el resultado que se muestra en la tabla 12 (sólo hemos incorporado la etiqueta de cada muestra: varones y mujeres).
Figura 1
Figura 1
Tabla 12

Prueba t para dos muestras suponiendo varianzas iguales

Varones

Mujeres

Media

16,075

21,183

Varianza

198,533

220,966

Observaciones

40,000

60,000

Varianza agrupada

212,038

Diferencia hipotética de las medias

0,000

Grados de libertad

98,000

Estadístico t

−1,719

P(Tt) una cola

0,044

Valor crítico de t (una cola)

1,661

P(Tt) dos colas

0,089

Valor crítico de t (dos colas)

1,984

Como podemos observar, Excel nos proporciona las medias y varianzas de cada muestra, el número de observaciones de cada muestra, la varianza agrupada (que es el cuadrado de la desviación estándar común, y con el que podemos obtener el error típico de la diferencia entre las medias), los grados de libertad (n1 + n2 − 2), el valor del estadístico de contraste observado (ya vimos cómo calcularlo), el valor p y el valor crítico para un contraste unilateral (o de una cola, que no es nuestro caso), así como el valor p y el valor crítico para un contraste bilateral (o de dos colas). Como vemos, los valores críticos que nos proporciona son en valor absoluto (sin signo), pero ya sabemos que estos valores pueden ser tanto positivos como negativos. Con todos estos datos ya podemos tomar una decisión, como sería en este caso la aceptación de la hipótesis nula (como ya vimos anteriormente) porque el estadístico de contraste observado (−1,719) es superior al valor crítico inferior (−1,984), o también porque el valor p (para prueba de dos colas) es mayor que el nivel de significación.
Como podemos observar en este caso (lo cual no es muy habitual), si hubiéramos hecho un contraste unilateral (una cola), la decisión que hubiéramos tomado (de mantener el nivel de significación en 0,05) hubiera sido distinta, ya que hubiéramos rechazado la hipótesis nula y aceptado la alternativa. Esto es así en este ejemplo porque la prueba aunque no es significativa (para dos colas), sí que está próxima a esta significación (el estadístico de contraste observado está próximo al valor crítico inferior, o el valor p está próximo al nivel de significación). Ello podría interpretarse como que, aunque estos datos no apoyan una diferencia significativa en el nivel de depresión entre varones y mujeres, sí que muestran una cierta diferencia que estaría próxima a dicha significación.

5.2.Contraste para dos varianzas en muestras independientes

Podemos realizar la prueba anterior, siguiendo el mismo ejemplo, utilizando Excel. La manera más rápida de realizarla es utilizando los programas preconfigurados del menú Herramientas.
Primero hemos aislado en un nuevo libro las dos variables estudiadas: sexo y M.A.S.
Para agrupar por un lado los hombres y por otro las mujeres, podemos ordenar los sujetos en función de su valor en la variable sexo, con lo cual tendremos los hombres en primer lugar y luego todas las mujeres. Para ordenar todos los sujetos según este criterio, seguimos la secuencia de instrucciones siguiente: Datos → Ordenar → y en el cuadro de diálogo, entramos: Ordenar por Sexo, y activamos Ascendente (si no está ya activado). Una vez agrupados primero los varones y luego las mujeres, ya podemos utilizar el programa preconfigurado para la comparación de dos medias en muestras independientes.
Para realizar la prueba, debemos seguir la secuencia de opciones de menú siguiente: Herramientas → Análisis de Datos → Prueba F para varianzas de dos muestras.
Debemos cumplimentar el cuadro de diálogo de dicha prueba como muestra la figura 2.
Como vemos en este cuadro de diálogo, hemos introducido el rango de entrada de los valores de las dos variables (M.A.S. para varones [variable 1] y M.A.S. para mujeres [variable 2]). El nivel de significación (alfa) que nos da por defecto es el de 0,05, pero podemos modificar este valor si queremos. Finalmente, como siempre, le pedimos que nos dé los resultados en una hoja nueva.
Figura 2
Figura 2
Si aceptamos, Excel nos proporciona el resultado que se muestra en la tabla 13 (sólo hemos incorporado la etiqueta de cada muestra: varones y mujeres).
Tabla 13

Prueba F para varianzas de dos muestras

Varones

Mujeres

Media

16,675

25,650

Varianza

167,558

134,774

Observaciones

40,000

60,000

Grados de libertad

39,000

59,000

F

1,243

P (Ff) una cola

0,222

Valor crítico para F (una cola)

1,602

Como podemos observar, Excel nos proporciona las medias y varianzas de cada muestra, el número de observaciones de cada muestra, los grados de libertad de cada muestra, el valor del estadístico de contraste observado (ya vimos cómo calcularlo), el valor p y el valor crítico para un contraste de una cola. Con todos estos datos ya podemos tomar una decisión, como sería en este caso la aceptación de la hipótesis nula (como ya vimos anteriormente) porque el estadístico de contraste observado (1,243) es menor que el valor crítico (1,602), o también porque el valor p es mayor que el nivel de significación (0,222 > 0,05).
Podemos concluir que, según los datos de la muestra de 100 sujetos del municipio estudiado, nada se opone a aceptar (con un nivel de significación de 0,05) que la variabilidad en ansiedad de los varones es igual a la de las mujeres.

5.3.ANOVA

Podemos realizar la prueba anterior (ANOVA), siguiendo el mismo ejemplo, utilizando Excel. El modo más rápido de realizarla es utilizando los programas preconfigurados del menú Herramientas.
Como hemos aplicado esta prueba sólo para 30 sujetos, los diez primeros de cada tipo de estado civil, deberemos generar una nueva matriz de datos con las puntuaciones en el B.D.I. de esos 30 sujetos. Además, Excel para realizar el ANOVA necesita que cada grupo de sujetos se situé en una columna diferente. Así, en nuestro ejemplo tendremos una matriz con 3 columnas y 10 filas (u 11 si etiquetamos cada grupo en la primera fila). Esta nueva matriz de datos será la que se muestra en la tabla 14.
Tabla 14

Soltero/a

Casado/a

Otros

0

7

3

8

9

10

7

1

2

5

6

18

9

3

19

4

16

17

3

8

12

12

7

4

1

9

12

14

12

3

Para realizar el ANOVA simple, debemos seguir la secuencia de opciones de menú siguiente: Herramientas → Análisis de datos → Análisis de varianza de un factor.
Debemos cumplimentar el cuadro de diálogo de dicha prueba como muestra la figura 3.
Figura 3
Figura 3
Como vemos en este cuadro de diálogo, hemos introducido el rango de entrada de los valores para los tres grupos (B.D.I. para solteros, casados y otros). Hemos indicado que estos valores están agrupados en columnas, que los grupos tienen su rótulo en la primera fila, que fijamos un α de 0,05 (que ya nos muestra por defecto) y, finalmente, como siempre, le pedimos que nos dé los resultados en una hoja nueva.
Si aceptamos, Excel nos proporciona el siguiente resultado (sólo hemos modificado algunas etiquetas para hacer el cuadro menos ancho).
Tabla 15

Grupos

Cuenta

Suma

Promedio

Varianza

Soltero/a

10

63

6,300

20,900

Casado/a

10

78

7,800

17,956

Otros

10

100

10,000

44,444

Tabla 16. Análisis de varianza

Origen de las variaciones

SC

df

CM

f

p

Valor crítico para F

Entre grupos

69,267

2

34,633

1,247

0,303

3,354

Dentro de los grupos

749,700

27

27,767

Total

818,967

29

Como podemos observar, Excel nos proporciona el tamaño, la suma de las puntuaciones, las medias y las varianzas de cada muestra o grupo en una primera tabla. En la tabla 16 nos proporciona el cuadro resumen de este ANOVA, con sus fuentes de variación (u origen de las variaciones), las sumas de cuadrados (SC), los grados de libertad (df), los cuadrados medios o varianzas (CM), el valor del estadístico de contraste f, su probabilidad p y el valor crítico de este estadístico de contraste.
Con todos estos datos ya podemos tomar una decisión, como sería en este caso la aceptación de la hipótesis nula (como ya vimos anteriormente), porque el estadístico de contraste observado (1,247) es menor que el valor crítico (3,354), o también porque el valor p (para prueba de dos colas) es mayor que el nivel de significación (0,05).
Por lo tanto, podemos concluir, al igual que hacíamos antes, que no existen diferencias significativas en el nivel de depresión de los sujetos en función de su estado civil. Dicho de otro modo, el nivel medio de depresión de los sujetos solteros, casados o de otros estados civiles es el mismo.
Si hubiéramos hecho esta prueba para la Escala E para todos los 100 sujetos de nuestra muestra (lo cual sería más lógico para el estudio), el resultado que nos proporcionaría Excel con la opción del ANOVA de un factor sería el de las tablas 17 y 18.
Análisis de varianza de un factor
Tabla 17. Resumen

Grupos

Cuenta

Suma

Media

Varianza

Soltero/a

30

320

10,667

24,713

Casado/a

43

512

11,907

29,134

Otros

27

348

12,889

19,718

Tabla 18. Análisis de varianza

Origen de las variaciones

SC

df

CM

f

p

Valor crítico para F

Entre grupos

71,039

2

35,519

1,405

0,250

3,090

Dentro de los grupos

2.452,961

97

25,288

Total

2.524

99

Que se interpretaría en el mismo sentido que ya veíamos con 30 sujetos.

Ejercicios de autoevaluación

1. Contraste de hipótesis para la proporción. Siguiendo con nuestro ejemplo práctico general, se quiere comprobar si la proporción de habitantes del municipio casados es o no es del 50 %. Para analizar esta cuestión, realizad el contraste de hipótesis adecuado, especificando los diferentes pasos que implica. Interpretad el resultado en el contexto del interrogante planteado (nivel de significació α = 0,05).

2. Contraste de hipótesis para una varianza. Siguiendo con nuestro ejemplo práctico general, se quiere comprobar si la variabilidad en el nivel de ansiedad (medido con el M.A.S) de los habitantes del municipio es igual a la variabilidad en la población general. Esta variabilidad en la población general se ha cuantificado, en estudios anteriores, como de una varianza igual a 100 (en puntuaciones en el M.A.S.). Para analizar esta cuestión, realizad el contraste de hipótesis adecuado, especificando los diferentes pasos que supone. Interpretad el resultado en el contexto del interrogante planteado. Realizad también el intervalo de confianza para la varianza en ansiedad de los habitantes del municipio analizado y comparad este resultado con el obtenido en el contraste de hipótesis (nivel de significació α = 0,05).

3. Contraste para dos medias en muestras independientes. Siguiendo con nuestro ejemplo práctico general, se quiere comprobar si hay diferencias en el nivel medio de ansiedad (medido con el M.A.S.) entre los varones y las mujeres del municipio estudiado. Para analizar esta cuestión, realizad el contraste de hipótesis adecuado, especificando los diferentes pasos que supone. Interpretad el resultado en el contexto del interrogante planteado. Calculad también el intervalo de confianza correspondiente e interpretad sus resultados, comparándolos con los del contraste de la hipótesis anterior (nivel de significació α = 0,05).

4. Contraste para dos varianzas en muestras independientes. Siguiendo con nuestro ejemplo práctico general, se quiere comprobar si hay diferencias en la variabilidad del nivel de depresión (medido con el B.D.I.) entre los varones y las mujeres del municipio estudiado. Para analizar esta cuestión, realizad el contraste de hipótesis adecuado, especificando los diferentes pasos que supone. Interpretad el resultado en el contexto del interrogante planteado (nivel de significació α = 0,05).

5. ANOVA. En esta actividad estudiaremos si hay diferencias en cuanto a la dimensión de personalidad de extraversión-introversión entre los sujetos de los tres grupos de estado civil (solteros/as, casados/as y otros). Para analizar esta cuestión, realizad el contraste de hipótesis adecuado mediante la opción correspondiente de Excel, especificando también los demás pasos (hipótesis estadísticas, etc.) que supone esta prueba. Interpretad el resultado en el contexto del interrogante planteado (nivel de significació α = 0,05).

6. Prueba de Mann-Whitney. En esta actividad, y siguiendo con nuestro ejemplo práctico general, se quiere comprobar si existen diferencias en el nivel medio de ansiedad (medido con el M.A.S.) entre los varones y las mujeres del municipio estudiado, pero suponiendo que sólo disponemos de los ocho primeros varones y las ocho primeras mujeres de nuestra muestra. Además, no podemos suponer que se cumpla la normalidad de la distribución de la variable ansiedad (M.A.S.) en la población. Para analizar esta cuestión, realizad el contraste de hipótesis adecuado, especificando los diferentes pasos que supone. Interpretad el resultado en el contexto del interrogante planteado (nivel de significació α = 0,05).

7. Prueba de Kruskal-Wallis. En esta actividad se quiere comprobar si hay diferencias en el nivel medio de ansiedad (medido con el M.A.S.) en función del estado civil de los habitantes del municipio estudiado en nuestro ejemplo práctico general, pero suponiendo que sólo disponemos de los cinco primeros sujetos de cada uno de los tres estados civiles de nuestra muestra (nivel de significació α = 0,01). Además, no podemos suponer que se cumpla la normalidad de la distribución de la variable ansiedad (M.A.S.) en la población. Para analizar esta cuestión, realizad el contraste de hipótesis adecuado, especificando los diferentes pasos que supone. Interpretad el resultado en el contexto del interrogante planteado.

Solucionario

Ejercicios de autoevaluación
1. Contraste de hipótesis para la proporción
H0: π = 0,5 // H1: π ≠ 0,5 (contraste bilateral).
Calculamos el error estándar de las proporciones. En este caso, es la misma operación y da el mismo resultado que el ejercicio de la pág. 11 del módulo: σp = 0,05.
Calculamos la z = (0,43 − 0,5)/0,05 = −1,4.
Para obtener el valor crítico de z, sabiendo que estamos ante un contraste bilateral con un α = 0,05, lo tenemos que obtener en las tablas de la distribución normal, o mediante la función del Excel, y el valor es 1,96.
Decisión: mantenemos la hipótesis nula, porque −1,4 inferior a −1,96 (en valores absolutos).

2. Contraste de hipótesis para una varianza
Varianza de la variable MAS: σ2 = 165,85.
H0: σ2 = 100 // H1: σ2 ≠ 100.
χ2 = ((100 − 1) * 165,85/100 = 164,19.
Buscamos en la tabla de χ2 (tabla 4 de las tablas estadísticas del módulo «Anexo») o mediante la función del Excel «PRUEBA.CHI.INV», los valores de χ2 para 99 grados de libertad son 73,361 y 128,422. Que son los valores que nos delimitan la zona de aceptación de H0. Dado que 164,19 no se encuentra dentro de este intervalo, rechazamos H0.

3. Contraste para dos medias en muestras independientes
Media mujeres 25,65; S = 11,61 // Media hombres 16,68; S = 12,94.
H0: μh = μd // H1: μh ≠ μd.
Calculamos el estadístico de contraste: t = 3,62.
Buscamos en la tabla de la distribución t (tabla 5 de las tablas estadísticas del módulo «Anexo») o con la función «DISTR.T.INV» de Excel, los valores críticos de la t de Student para 98 grados de libertad y un grado de significació α de 0,05 para prueba de dos colas (contraste bilateral); este valor es de 1,98 (de hecho ya sabemos que son ±1,98). Dado que 3,62 es mayor que 1,98, rechazamos H0 y podemos afirmar que la diferencia en las puntuaciones de la variable MAS de hombres y mujeres es significativa.

4. Contraste para dos varianzas en muestras independientes
S2 mujeres = 220,97 // S2 hombres = 198,53.
H 0 σ h 2 = σ d 2  //  H 1 σ h 2 σ d 2
Calculamos el estadístico de contraste F = 220,97/198,53 = 1,113.
Tenemos que obtener en las tablas de la distribución f (tabla 6 de las tablas estadísticas del módulo «Anexo»), o mediante la función «DISTR.F.INV» del Excel. Dado que la varianza en el grupo de mujeres es más grande que la de los hombres, el valor crítico para 59 grados de libertad en el numerador (n1 − 1), y 39 grados de libertad para el denominador (n2 − 1), con un grado de significación de 0,05.
Con Excel, con 59 y 39 grados de libertad, obtendríamos el valor 1,60:
DISTR.F.INV(0,05;59;39)=1,647074732
Dado que 1,113 es inferior a 1,650, mantenemos H0 y podemos afirmar la igualdad de las varianzas.

5. ANOVA
Media solteros: 8,30; S = 7,42 // Media casados: 10,21; S = 6,52 // Media otras: 11,11; S = 8,48.
H0: μs = μc = μa.
Calculamos con el ANOVA el estadístico de contraste F = 1,11.
Para obtener el valor crítico de este estadístico de contraste, utilizamos la función «DISTR.F.INV» del Excel, para una probabilidad de 0,05 (nivel de significació α igual a 0,05), y 2 grados de libertad en el numerador y 97 grados de libertad en el denominador. Este valor crítico es de 3,07 (el valor más próximo a 97 en la tabla 120).
Tenemos que aceptar la hipótesis nula que planteaba que las tres medias son iguales (μ1 = μ2 = μ3), porque el estadístico de contrastes observado es menor que el valor crítico de la prueba (1,113 < 3,07).

6. Prueba de Mann-Whitney

Hombres

8

2

4

2

5

21

0

0

Mujeres

12

14

8

24

6

3

26

9

Hipótesis nula: la tendencia central (o mediana Mdn) en depresión de los hombres es igual a la de las mujeres: Mdnh = Mdnd.
Hipótesis alternativa: MdnhMdnd.

Puntuación

0

0

2

2

3

4

5

6

8

8

9

12

14

21

24

26

Rango

1,5

1,5

3,5

3,5

5

6

7

8

9,5

9,5

11

12

13

14

15

16

Hombres

1,5

1,5

3,5

3,5

6

7

9,5

14

46,5

Mujeres

5

8

9,5

11

12

13

15

16

89,5

Así, el valor de U es de 46,5 (el menor valor encontrado de la suma de rangos de cada una de las dos muestras).
Valor crítico de la prueba: para obtener el valor crítico de la prueba de Mann-Whitney, consultamos la tabla 8bis del módulo «Anexo». En este caso, buscaremos el valor de U que corresponde a una n igual a 8 a los dos casos y α de 0,05 (aunque en las tablas hay que buscar α/2, es decir, 0,025):
U ( n 1 = 8 , n 2 = 8 , α / 2 = 0,25 ) = 50
Decisión: rechazamos la hipótesis nula, porque el valor de la U observada (46,5) es más pequeño que el valor crítico para esta prueba (50).
Interpretación: podemos concluir que hay diferencias significativas entre el nivel medio de ansiedad de los hombres y las mujeres.

7. Prueba de Kruskal-Wallis

Solteros

4

21

6

3

0

Casados

8

2

2

14

8

Otros

12

5

24

0

5

Hipótesis nula: las tendencias centrales (o mediana Mdn) de las diferentes muestras estudiadas son iguales: Mdns = Mdnc = Mdna.
Hipótesis alternativa: la tendencia central (o mediana) de al menos una de las muestras es diferente a la tendencia central de las otras.

Puntuación

0

0

2

2

3

4

5

5

6

8

8

12

14

21

24

Rango

1,5

1,5

3

4

5

6

7,5

7,5

9

10,5

10,5

12

13

14

15

Solteros

1,5

5

6

9

14

35,5

Casados

3

4

10,5

10,5

13

41

Otros

1,5

7,5

7,5

12

15

43,5

H = 0,335.
H* = 0,337.
Valor crítico de la prueba: el estadístico H tiene una distribución propia que se presenta en la tabla 9 de las tablas del módulo «Anexo». El valor crítico en función de las medidas muestrales (n1, n2 y n3), y del nivel de significació α. Así, para este caso
H ( n 1 = 5 , n 2 = 5 , n 3 = 5 , α = 0,01 ) = 7,98 .
Decisión: mantenemos la hipótesis nula, porque el valor de la H observada (0,337) es menor que el valor crítico (7,98).
Interpretación: tenemos que concluir que nada se opone a aceptar que no hay diferencias en el grado medio de ansiedad de los sujetos en función de su estado civil (nivel de significación de 0,01).