Cuando se utiliza una prueba de hipótesis para comprobar una hipótesis, se está emitiendo un juicio sobre si una hipótesis es verdadera o no. Pues bien, en el mundo de la estadística, las pruebas de hipótesis no son perfectas: ¡a veces su conclusión es incorrecta! En este artículo, veremos una de las formas específicas en las que su conclusión puede ser incorrecta, llamada error de tipo II (o error de tipo 2).
Si desea aprender más sobre las pruebas de hipótesis y otros temas de estadística, nuestras lecciones de vídeo de estadística pueden ayudarle!
Definiciones de tipo de error
Hay dos posibilidades en el mundo real: o la hipótesis nula es correcta, o es incorrecta. No sabemos cuál es el caso, por eso hacemos una prueba de hipótesis en primer lugar. Y claro, la prueba de hipótesis te dará el resultado correcto la mayoría de las veces… pero cuando el resultado es erróneo, es importante saber cómo puede ser erróneo y qué significa.
- Si la situación real es que la hipótesis nula es correcta, entonces o bien tu prueba funciona (fallas correctamente al rechazar la hipótesis nula) o tu prueba no funciona (rechazas incorrectamente la hipótesis nula). Este tipo concreto de error se denomina «error de tipo I».
- Si la situación real es que la hipótesis nula es incorrecta, entonces o bien su prueba funciona (rechaza correctamente la hipótesis nula) o bien su prueba no funciona (no rechaza incorrectamente la nula). Esto se denomina «error de tipo II».
Examinemos más de cerca estos errores de tipo II: cómo ocurren, qué significan y qué se puede hacer al respecto.
Ejemplo de error de tipo II
Digamos que estamos probando un nuevo champú para ver si hace crecer el pelo más rápido. Sabemos que la tasa media de crecimiento del cabello es de 0,5 pulgadas por mes. Damos nuestro champú a los sujetos de prueba y medimos el crecimiento de su cabello. Tal vez el crecimiento medio del cabello entre nuestros sujetos de prueba sea de 0,6 pulgadas por mes. Es un poco más alto que la media, pero está lo suficientemente cerca como para que tengamos que preguntarnos si esta diferencia se debe al azar. ¿O es algo que podemos atribuir a nuestro nuevo champú?
La hipótesis nula, en este caso, es que el champú no ayuda a aumentar el crecimiento del cabello-que la tasa de crecimiento del cabello entre todas las personas que utilizan nuestro champú no sería diferente de la tasa de crecimiento del cabello entre todas las personas. (La hipótesis nula suele reducirse a «ningún cambio» o «ninguna diferencia»).
Ahora, supongamos que la verdad real es que nuestro champú realmente hace crecer el pelo más rápido, porque somos unos genios de la fabricación de champús. No sabemos si funciona, pero realizamos una prueba de hipótesis utilizando nuestros datos recogidos para intentar averiguar si funciona o no.
Si el valor P de nuestra prueba es lo suficientemente pequeño, rechazaremos la hipótesis nula. ¡Eso es genial! Hemos rechazado correctamente la nula y hemos concluido que nuestro champú hace crecer el pelo más rápido. En ese caso:
- Comercializamos el champú a una empresa de renombre, entonces
- Una celebridad retuitea nuestra investigación, tras lo cual
- Llegan toneladas de pedidos, y así
- Ganamos millones de dólares y el mundo tiene un pelo que crece más rápido. Todo el mundo gana
- Si las consecuencias de un error de Tipo II son peores que las de un error de Tipo I, podría decidir que alfa debería ser un poco más alto, como 0,10.
- Si las consecuencias de un error de Tipo I son peores, establezca alfa más bajo, tal vez 0,01.
- Si las consecuencias son más o menos las mismas en ambos casos, elija alfa en algún punto intermedio, tal vez 0,05.
Por otro lado, podría darse el caso de que el valor P no sea lo suficientemente pequeño como para rechazar la hipótesis nula. Si la realidad es que el champú realmente hace que el pelo crezca más rápido, y lo pasamos por alto al no rechazar la hipótesis nula, entonces hemos cometido un error de tipo II.
¿Qué significa esto para nosotros? Pues que podríamos pensar (incorrectamente) que nuestro champú no funciona como queremos. Podríamos desechar esa fórmula millonaria y volver a la mesa de dibujo.
¡Está claro que los errores de tipo II pueden tener graves consecuencias!
¿Por qué se producen los errores de tipo II?
Algunos factores pueden contribuir a un error de tipo II. Son más probables cuando el cambio real en el parámetro de la población es pequeño; por ejemplo, si el champú aumenta la tasa de crecimiento del cabello, pero sólo en una pequeña cantidad. Un pequeño cambio es más difícil de detectar que una diferencia drástica, y puede pasarse por alto más fácilmente.
En nuestro ejemplo, el cambio en la tasa de crecimiento del cabello fue lo suficientemente pequeño como para atribuirlo al azar.
Los errores de tipo II también son más probables con un tamaño de muestra pequeño. Si el número de sujetos en el experimento no es lo suficientemente grande, un cambio real todavía puede conducir a un valor P que es demasiado grande para rechazar el nulo, lo que es un error de tipo II.
También es posible que simplemente hayamos tenido mala suerte: debido a la variabilidad aleatoria en nuestros sujetos, un cambio real que debería haber sido evidente no estaba allí, o no era lo suficientemente grande como para distinguirlo de la variabilidad aleatoria.
¿Se pueden evitar los errores de tipo II?
Algunas técnicas pueden ayudar a evitar los errores de tipo I o de tipo II: repetir el experimento varias veces o utilizar un grupo más grande de sujetos. Estas mejoras suelen estar limitadas por la practicidad. ¿Cuántas rondas de pruebas podemos permitirnos? ¿Cuántas muestras de champú podemos enviar?
Otra forma de evitar específicamente los errores de Tipo II es aumentar el umbral al que se rechaza la hipótesis nula (llamado nivel alfa, o α). Una elección típica para alfa es 0,05, por lo que cualquier valor P inferior a 0,05 llevaría a rechazar la nula, y cualquier valor P superior a 0,05 llevaría a no rechazar la nula.
Aumentar el nivel de alfa a 0,10 significaría que rechazaría la nula con más frecuencia, por lo que se reducen las posibilidades de un error de tipo II.
Sin embargo, hay una compensación con estos dos tipos de errores. Si aumenta el nivel alfa, va a rechazar la hipótesis nula con más frecuencia. Eso es genial si la hipótesis nula es realmente incorrecta, pero a veces es correcta. Si es correcta y la rechaza incorrectamente, entonces ha cometido un error de tipo I.
La probabilidad de un error de tipo I es igual al nivel alfa. Si aumenta el umbral de alfa para que se reduzca la probabilidad de un error de Tipo II, entonces también está aumentando la probabilidad de un error de Tipo I.
Así que, en la práctica, tiene que decidir qué tipo de error es más peligroso, y tratar de evitar ese.
Por ejemplo, con el champú para el crecimiento del cabello, definitivamente no queremos perder millones de dólares, por lo que no nos gustan los errores de Tipo II… pero un error de Tipo I también es malo. Si nuestro producto no funciona pero afirmamos que sí, podríamos tener problemas con nuestros clientes cuando no vean resultados, ¡y tal vez problemas con el gobierno por publicidad falsa!
Resumen
Un error de Tipo II se conoce a veces como «falso negativo». Es lo que llamamos cuando la prueba de hipótesis no rechaza la hipótesis nula, aunque la nula debería haber sido rechazada.
Significa que no hemos encontrado un cambio significativo en alguna parte.
Puede reducir la posibilidad de un error de tipo II, pero tenga cuidado: aumentar el nivel alfa reducirá la posibilidad de un error de tipo II y aumentará la posibilidad de un error de tipo I.