Quando se usa um teste de hipóteses para testar uma hipótese, está-se a fazer um julgamento sobre se uma hipótese é ou não verdadeira. Bem, no mundo da estatística, os testes de hipóteses não são perfeitos – por vezes, a sua conclusão é incorrecta! Neste artigo, vamos analisar uma das formas específicas que a sua conclusão pode estar errada, chamada erro Tipo II (ou erro Tipo 2).
Se quiser aprender mais sobre testes de hipóteses e outros tópicos de estatística, as nossas lições de estatística em vídeo podem ajudá-lo!
Error Type Definitions
Existem duas possibilidades no mundo real: ou a hipótese nula está certa, ou está errada. Não sabemos qual é o caso e é por isso que estamos a fazer um teste de hipótese em primeiro lugar. E claro, o teste de hipótese dar-lhe-á o resultado correcto a maior parte do tempo… mas quando o resultado está errado, é importante saber como pode estar errado e o que isso significa.
- Se a situação real é a hipótese nula está certa, então ou o seu teste funciona (não consegue rejeitar correctamente a hipótese nula) ou o seu teste não funciona (rejeita incorrectamente a hipótese nula). Este tipo particular de erro chama-se “erro de Tipo I”
- se a situação real é a hipótese nula está errada, então ou o seu teste funciona (rejeita correctamente a hipótese nula) ou o seu teste não funciona (não rejeita incorrectamente a hipótese nula). A isto chama-se um “erro de Tipo II”.
Vejamos mais de perto estes erros de Tipo II: como acontecem, o que significam, e o que pode ser feito em relação a isso.
Exemplo de erro de Tipo II
Vejamos se estamos a testar um novo champô para ver se faz o cabelo crescer mais rapidamente. Sabemos que a taxa média de crescimento do cabelo é de 0,5 polegadas por mês. Damos o nosso champô aos sujeitos do teste e medimos o seu crescimento de cabelo. Talvez a taxa média de crescimento de cabelo entre os nossos sujeitos de teste seja de 0,6 polegadas por mês. Isso é um pouco mais alto do que a média, mas é suficientemente próximo para termos de perguntar – será que esta diferença se deve a uma hipótese aleatória? Ou será algo que podemos atribuir ao nosso novo champô?
A hipótese nula, neste caso, é que o champô não ajuda a aumentar o crescimento do cabelo – que a taxa de crescimento do cabelo entre todas as pessoas que usam o nosso champô não seria diferente da taxa de crescimento do cabelo entre todas as pessoas. (A hipótese nula pode normalmente ser reduzida a “nenhuma mudança” ou “nenhuma diferença”).
Agora, vamos supor que a verdade real é que o nosso champô faz realmente o cabelo crescer mais rapidamente, porque somos génios que fazem champô. Não sabemos se funciona, mas fazemos um teste de hipóteses usando os nossos dados recolhidos para tentar descobrir se funciona ou não.
Se o valor P do nosso teste for suficientemente pequeno, rejeitaremos a hipótese nula. Isso é óptimo! Rejeitamos correctamente a hipótese nula e concluímos que o nosso champô faz o cabelo crescer mais rapidamente. Nesse caso:
- comercializamos o champô a uma grande empresa, depois
- Uma celebridade replica a nossa pesquisa, depois do que
- Toneladas de encomendas entram, e assim
- Fazemos milhões de dólares e o mundo tem cabelo de crescimento mais rápido. Todos ganham!
Por outro lado, pode acontecer que o valor P não seja suficientemente pequeno para rejeitar a hipótese nula. Se a realidade é que o champô faz realmente o cabelo crescer mais rapidamente, e nós perdemo-lo ao não rejeitar a hipótese nula, então cometemos um erro de Tipo II.
O que é que isto significa para nós? Bem, podemos pensar (incorrectamente) que o nosso champô não funciona da forma que desejamos. Podemos deitar fora essa fórmula de milhões de dólares e voltar à prancheta de desenho.
Claramente erros de Tipo II podem ter consequências graves!
Porquê os erros de Tipo II acontecem?
Alguns factores podem contribuir para um erro de Tipo II. São mais prováveis quando a alteração real no parâmetro da população é pequena – por exemplo, se o champô aumenta a taxa de crescimento do cabelo, mas apenas numa pequena quantidade. Uma pequena alteração é mais difícil de detectar do que uma diferença dramática, e pode ser mais facilmente ignorada.
No nosso exemplo, a alteração na taxa de crescimento do cabelo foi suficientemente pequena para a atribuir ao acaso.
Os erros do tipo II são também mais prováveis com um tamanho de amostra pequeno. Se o número de sujeitos na experiência não for suficientemente grande, uma mudança real ainda pode levar a um valor P demasiado grande para rejeitar o nulo, que é um erro de Tipo II.
É também possível que tenhamos acabado de ter azararar a variabilidade aleatória dos nossos sujeitos, uma mudança real que deveria ter sido aparente não existia, ou não era suficientemente grande para a distinguir da variabilidade aleatória.
Pode evitar-se erros de Tipo II?
algumas técnicas podem ajudar a evitar erros de Tipo I ou de Tipo II: repita a sua experiência várias vezes, ou utilize um grupo maior de sujeitos. Estas melhorias são muitas vezes limitadas pela praticidade. Quantas rondas de testes podemos nós pagar? Quantas amostras de champô podemos enviar?
Outra forma de evitar especificamente os erros de Tipo II é aumentar o limiar a partir do qual se rejeita a hipótese nula (chamado nível alfa, ou α). Uma escolha típica para alfa é 0,05- por isso qualquer valor P inferior a 0,05 levaria à rejeição do nulo, e qualquer valor P superior a 0,05 levaria à não rejeição do nulo.
Aumentar o nível alfa para 0,10 significaria rejeitar o nulo com mais frequência, pelo que as hipóteses de um erro de Tipo II são reduzidas.
No entanto, há uma troca com estes dois tipos de erros. Se aumentar o nível alfa, vai rejeitar a hipótese nula com mais frequência. Isso é óptimo se a hipótese nula estiver realmente errada, mas por vezes está certa. Se estiver certa e a rejeitar incorrectamente, então cometeu um erro de Tipo I.
A hipótese de um erro de Tipo I é igual ao nível alfa. Se aumentar o limiar alfa para que a hipótese de erro de Tipo II seja reduzida, então também está a aumentar a hipótese de erro de Tipo I.
Então, na prática, tem de decidir que tipo de erro é mais perigoso, e tentar evitar esse tipo de erro.
- Se as consequências de um erro de Tipo II forem piores do que um erro de Tipo I, poderá decidir alfa um pouco mais alto, como 0,10.
- Se as consequências de um erro de Tipo I forem piores, defina alfa mais baixo, talvez 0,01.
- Se as consequências forem mais ou menos as mesmas, escolha alfa algures no meio, talvez 0,05.
Por exemplo, com o champô para o cabelo, não queremos definitivamente perder milhões de dólares, por isso não gostamos de erros de Tipo II… mas um erro de Tipo I também é mau. Se o nosso produto não funcionar mas afirmamos que funciona, podemos estar em apuros com os nossos clientes quando não vêem resultados, e talvez em apuros com o governo por publicidade falsa!
Sumário
Um erro de Tipo II é por vezes referido como “falso negativo”. É o que lhe chamamos quando o teste de hipótese não rejeita a hipótese nula, mesmo que o nulo devesse ter sido rejeitado.
Significa que falhámos em encontrar uma alteração significativa algures.
Pode reduzir a hipótese de um erro de Tipo II, mas seja cuidadoso – elevar o nível alfa reduzirá a hipótese de um erro de Tipo II e aumentará a hipótese de um erro de Tipo I.