Definizione ed esempi di errore di tipo II

Quando si usa un test di ipotesi per verificare un’ipotesi, si sta dando un giudizio sul fatto che un’ipotesi sia vera o meno. Bene, nel mondo della statistica, i test d’ipotesi non sono perfetti – a volte la tua conclusione è sbagliata! In questo articolo, esamineremo uno dei modi specifici in cui la tua conclusione potrebbe essere sbagliata, chiamato errore di tipo II (o errore di tipo 2).

Se vuoi saperne di più sulla verifica delle ipotesi e su altri argomenti di statistica, le nostre video lezioni di statistica possono aiutarti!

Definizioni del tipo di errore

Ci sono due possibilità nel mondo reale: o l’ipotesi nulla è giusta, o è sbagliata. Non sappiamo quale sia il caso – ecco perché stiamo facendo un test d’ipotesi in primo luogo. E certo, il test d’ipotesi vi darà il risultato corretto la maggior parte delle volte… ma quando il risultato è sbagliato, è importante sapere come può essere sbagliato e cosa significa.

  • Se la situazione reale è che l’ipotesi nulla è giusta, allora o il vostro test funziona (non rigettate correttamente l’ipotesi nulla) o il vostro test non funziona (rigettate erroneamente l’ipotesi nulla). Questo particolare tipo di errore è chiamato “errore di tipo I.”
  • Se la situazione reale è che l’ipotesi nulla è sbagliata, allora o il vostro test funziona (rigettate correttamente l’ipotesi nulla) o il vostro test non funziona (non rigettate erroneamente l’ipotesi nulla). Questo è chiamato un “errore di tipo II”.

Diamo un’occhiata più da vicino a questi errori di tipo II: come accadono, cosa significano e cosa si può fare al riguardo.

Esempio di errore di tipo II

Diciamo che stiamo testando un nuovo shampoo per vedere se fa crescere i capelli più velocemente. Sappiamo che il tasso medio di crescita dei capelli è di 0,5 pollici al mese. Diamo il nostro shampoo ai soggetti del test e misuriamo la loro crescita dei capelli. Forse la crescita media dei capelli tra i nostri soggetti del test è di 0,6 pollici al mese. Questo è un po’ più alto della media, ma è abbastanza vicino che dobbiamo chiedere: questa differenza è dovuta al caso? O è qualcosa che possiamo attribuire al nostro nuovo shampoo?

L’ipotesi nulla, in questo caso, è che lo shampoo non aiuta ad aumentare la crescita dei capelli – che il tasso di crescita dei capelli tra tutte le persone che usano il nostro shampoo non sarebbe diverso dal tasso di crescita dei capelli tra tutte le persone. (L’ipotesi nulla di solito si riduce a “nessun cambiamento” o “nessuna differenza”).

Ora, supponiamo che la vera verità sia che il nostro shampoo faccia effettivamente crescere i capelli più velocemente, perché siamo dei geni dello shampoo. Non sappiamo se funziona, ma facciamo un test d’ipotesi usando i dati raccolti per cercare di scoprire se funziona o no.

Se il valore P del nostro test è abbastanza piccolo, rifiuteremo l’ipotesi nulla. Fantastico! Abbiamo rifiutato correttamente l’ipotesi nulla e concluso che il nostro shampoo fa crescere i capelli più velocemente. In questo caso:

  • Commercializziamo lo shampoo ad una grande azienda, poi
  • Una celebrità ritwitta la nostra ricerca, dopodiché
  • Tonnellate di ordini arrivano, e così
  • Facciamo milioni di dollari e il mondo ha capelli che crescono più velocemente. Tutti vincono!

D’altra parte, potrebbe essere il caso che il valore P non è abbastanza piccolo per rifiutare l’ipotesi nulla. Se la realtà è che lo shampoo fa effettivamente crescere i capelli più velocemente, e noi non riusciamo a respingere l’ipotesi nulla, allora abbiamo commesso un errore di tipo II.

Cosa significa questo per noi? Beh, potremmo pensare (erroneamente) che il nostro shampoo non funziona come vogliamo. Potremmo buttare via quella formula da un milione di dollari e tornare al tavolo da disegno.

E’ chiaro che gli errori di tipo II possono avere serie conseguenze!

Perché si verificano gli errori di tipo II?

Alcuni fattori possono contribuire a un errore di tipo II. Sono più probabili quando il cambiamento effettivo nel parametro della popolazione è piccolo – per esempio, se lo shampoo aumenta il tasso di crescita dei capelli, ma solo di una piccola quantità. Un piccolo cambiamento è più difficile da individuare di una differenza drammatica, e può essere più facilmente perso.

Nel nostro esempio, il cambiamento nel tasso di crescita dei capelli era abbastanza piccolo da attribuirlo al caso casuale.

Gli errori di tipo II sono anche più probabili con una piccola dimensione del campione. Se il numero di soggetti nell’esperimento non è abbastanza grande, un cambiamento reale può ancora portare a un valore P troppo grande per rifiutare il nulla, che è un errore di tipo II.

È anche possibile che siamo stati semplicemente sfortunati – a causa della variabilità casuale nei nostri soggetti, un cambiamento reale che avrebbe dovuto essere evidente non c’era, o non era abbastanza grande per distinguerlo dalla variabilità casuale.

Gli errori di tipo II possono essere evitati?

Alcune tecniche possono aiutare ad evitare sia gli errori di tipo I che quelli di tipo II: ripetere l’esperimento più volte, o usare un gruppo più grande di soggetti. Questi miglioramenti sono spesso limitati dalla praticità. Quanti cicli di test possiamo permetterci? Quanti campioni di shampoo possiamo spedire?

Un altro modo per evitare specificamente gli errori di tipo II è quello di aumentare la soglia alla quale si rifiuta l’ipotesi nulla (chiamata livello alfa, o α). Una scelta tipica per alfa è 0,05-quindi ogni valore di P inferiore a 0,05 porterebbe a rifiutare l’ipotesi nulla, e ogni valore di P superiore a 0,05 porterebbe a non rifiutare l’ipotesi nulla.

Alzare il livello alfa a 0,10 significherebbe rifiutare l’ipotesi nulla più spesso, quindi le possibilità di un errore di tipo II sono ridotte.

Tuttavia, c’è un trade-off con questi due tipi di errori. Se si aumenta il livello alfa, si rifiuta più spesso l’ipotesi nulla. Questo è fantastico se l’ipotesi nulla è effettivamente sbagliata, ma a volte è giusta. Se è giusta e la rifiutate erroneamente, allora avete commesso un errore di tipo I.

La probabilità di un errore di tipo I è uguale al livello alfa. Se si aumenta la soglia alfa in modo da ridurre la possibilità di un errore di tipo II, si aumenta anche la possibilità di un errore di tipo I.

Quindi, in pratica, bisogna decidere quale tipo di errore è più pericoloso, e cercare di evitare quello.

  • Se le conseguenze di un errore di tipo II sono peggiori di un errore di tipo I, si può decidere che alfa sia un po’ più alto, come 0,10.
  • Se le conseguenze di un errore di tipo I sono peggiori, impostate alfa più basso, forse 0,01.
  • Se le conseguenze sono circa le stesse in entrambi i casi, scegliete alfa da qualche parte nel mezzo, forse 0,05.

Per esempio, con lo shampoo per la crescita dei capelli, non vogliamo assolutamente perdere milioni di dollari, quindi non ci piacciono gli errori di tipo II… ma anche un errore di tipo I è brutto. Se il nostro prodotto non funziona, ma noi affermiamo che funziona, potremmo essere nei guai con i nostri clienti quando non vedono i risultati, e forse nei guai con il governo per falsa pubblicità!

Sommario

Un errore di tipo II è a volte indicato come un “falso negativo”. Lo chiamiamo così quando il test d’ipotesi non rifiuta l’ipotesi nulla, anche se la nulla avrebbe dovuto essere rifiutata.

Significa che non abbiamo trovato un cambiamento significativo da qualche parte.

È possibile ridurre la possibilità di un errore di tipo II, ma attenzione: aumentando il livello alfa si riduce la possibilità di un errore di tipo II e si aumenta la possibilità di un errore di tipo I.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *