Una tabella incrociata è una tabella che mostra la relazione tra due o più variabili. Quando la tabella mostra solo la relazione tra due variabili categoriche, una tabella incrociata è anche conosciuta come tabella di contingenza.
Esempio di una tabella incrociata di due variabili
La tabella qui sotto è una tabella incrociata che mostra per età se qualcuno ha un numero di telefono non in elenco. Questa tabella mostra il numero di osservazioni con ogni combinazione di valori possibili delle due variabili in ogni cella della tabella. Possiamo vedere, per esempio, che 185 persone hanno un’età compresa tra i 18 e i 34 anni e non hanno un numero di telefono non elencato. Sono mostrate anche le percentuali delle colonne (queste sono percentuali all’interno delle colonne, così che le percentuali di ogni colonna si sommano al 100%); per esempio, il 24% di tutte le persone che non hanno un numero di telefono non elencato sono di età compresa tra i 18 e i 34 anni nel campione.
La distribuzione per età delle persone senza numeri non elencati è diversa da quella delle persone con numeri non elencati. In altre parole, la tabella incrociata rivela una relazione tra i due: le persone con numeri di telefono non quotati hanno più probabilità di essere più giovani. Quindi, possiamo anche dire che le variabili usate per creare questa tabella sono correlate. Se non ci fosse alcuna relazione tra queste due variabili categoriche, diremmo che non sono correlate.
In questo esempio, le due variabili possono essere viste entrambe come ordinate. Di conseguenza, possiamo potenzialmente descrivere i modelli come correlazioni positive o negative (negative nella tabella mostrata). Tuttavia, quando entrambe le variabili non sono ordinate, possiamo semplicemente riferirci alla forza della correlazione senza discutere la sua direzione (cioè, se è positiva o negativa).
Tabelle incrociate con più di due variabili
È comune che le tabelle incrociate contengano più di due variabili. Per esempio, la tabella qui sotto mostra quattro variabili. Le righe rappresentano una variabile categorica, che registra le preferenze di marca, e le colonne rappresentano l’età e il reddito all’interno del genere.
Le tabelle incrociate sono abitualmente create con molte più variabili. Per esempio, ogni riga e ogni colonna possono rappresentare una variabile diversa.
Decisioni chiave quando si crea una tabella incrociata
Oltre a selezionare quali variabili includere in una tabella incrociata, è anche necessario capire quali statistiche mostrare. In questo esempio, viene mostrata la colonna % e la dimensione del campione per ogni colonna.
Una seconda decisione chiave è come mostrare la significatività statistica. L’esempio qui sopra usa il lettering, che indica se una colonna è significativa per un’altra colonna specifica. In alternativa, si possono usare test che mostrano se una cella è diversa dal suo complemento.
Terminologia
Nella ricerca commerciale, le righe di una tabella trasversale sono storicamente indicate come stub e le colonne come banner.
Guarda altre pratiche guide su Cos’è… o vai al resto del nostro blog!