13.2 Igualdad de medias y t-test

Los datos que vamos a usar están bajados de http://archive.ics.uci.edu/ml/datasets/Student+Performance. Se refieren al desempeño académico de una serie de alumnos portugueses en función de una serie de indicadores sociodemográficos.

mat.por <- read.table("data/student-mat.csv", header = T, sep = ";")

Las variables G1, G2 y G3 se refieren a las notas obtenidas en tres exámenes distintos y nuestro objetivo será analizar las diferencias por sexos en el último examen, G3. Primero, gráficamente, con un diagrama de cajas:

boxplot(mat.por$G3 ~ mat.por$sex, col = "gray", xlab = "sexo", ylab = "nota final")

Se aprecia una pequeña diferencia en favor de los chicos. Es la diferencia observada, que puede deberse al azar. Por eso se puede aplicar una prueba estadística (en este caso, el llamado test de Student o t-test) para determinar si esa diferencia observada es o no significativa:

res <- t.test(mat.por$G3 ~ mat.por$sex)
res
## 
##  Welch Two Sample t-test
## 
## data:  mat.por$G3 by mat.por$sex
## t = -2.0651, df = 390.57, p-value = 0.03958
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.85073226 -0.04545244
## sample estimates:
## mean in group F mean in group M 
##        9.966346       10.914439

El objeto res contiene la información relevante sobre la prueba realizada y al ser imprimido muestra un resumen, el típico resumen que suele mostrarse en los estudios en el que se aplica: el intervalo de confianza para la diferencia de medias de interés y el p-valor correspondiente. En este caso el p-valor es ligeramente inferior al umbral habitual de 0.05, por lo que en muchos contextos se hablaría de rechazar la hipótesis de igualdad de medias efectivamente aceptando un peor desempeño académico de las chicas en este examen con respecto a sus homólogos masculinos.

El p-valor, por si interesase utilizarlo para otros fines, puede extraerse así:

res$p.value
## [1] 0.039577

res es un objeto, ¿de qué clase? También es una lista: examínala. ¿Puedes identificar en ella todos los elementos que forman parte del resumen mostrado más arriba?

Busca en Google r non parametric alternative to t-test e identifica un test no paramétrico alternativo al t-test. Úsalo para determinar si las notas finales entre sexos “son o no iguales”.

Pruebas estadíticas similares a las anteriores se realizan habitualmente para, por ejemplo, comparar el desempeño (en términos, p.e., de conversiones) entre dos versiones de una página web, de dos campañas publicitarias distintas, de dos tratamientos médicos alternativos, etc.