1. Dati univariati –
Questo tipo di dati consiste in una sola variabile. L’analisi dei dati univariati è quindi la forma più semplice di analisi poiché l’informazione riguarda solo una quantità che cambia. Non si occupa di cause o relazioni e lo scopo principale dell’analisi è quello di descrivere i dati e trovare modelli che esistono al loro interno. L’esempio di un dato univariato può essere l’altezza.
Supponiamo che l’altezza di sette studenti di una classe sia registrata (figura 1), c’è solo una variabile che è l’altezza e non si tratta di alcuna causa o relazione. La descrizione dei modelli trovati in questo tipo di dati può essere fatta traendo conclusioni usando misure di tendenza centrale (media, mediana e modalità), dispersione o diffusione dei dati (intervallo, minimo, massimo, quartili, varianza e deviazione standard) e usando tabelle di distribuzione della frequenza, istogrammi, grafici a torta, poligoni di frequenza e grafici a barre.
2. Dati bivariati –
Questo tipo di dati coinvolge due diverse variabili. L’analisi di questo tipo di dati si occupa di cause e relazioni e l’analisi viene fatta per scoprire la relazione tra le due variabili. Esempio di dati bivariati possono essere la temperatura e le vendite di gelato nella stagione estiva.
Supponiamo che la temperatura e le vendite di gelato siano le due variabili di un dato bivariato (figura 2). Qui, la relazione è visibile dalla tabella che la temperatura e le vendite sono direttamente proporzionali l’una all’altra e quindi correlate perché all’aumentare della temperatura, aumentano anche le vendite. Così l’analisi dei dati bivariati comporta confronti, relazioni, cause e spiegazioni. Queste variabili sono spesso tracciate sugli assi X e Y del grafico per una migliore comprensione dei dati e una di queste variabili è indipendente mentre l’altra è dipendente.
3. Dati multivariati –
Quando i dati coinvolgono tre o più variabili, sono classificati sotto multivariati. Un esempio di questo tipo di dati è supporre che un inserzionista voglia confrontare la popolarità di quattro annunci su un sito web, quindi i loro tassi di clic potrebbero essere misurati per uomini e donne e le relazioni tra le variabili possono essere esaminate.
È simile alla bivariata ma contiene più di una variabile dipendente. I modi per eseguire l’analisi su questi dati dipendono dagli obiettivi da raggiungere.Alcune delle tecniche sono l’analisi di regressione, l’analisi del percorso, l’analisi dei fattori e l’analisi multivariata della varianza (MANOVA).
Attenzione lettore! Non smettere di imparare ora. Impara tutti i concetti importanti di teoria CS per le interviste SDE con il corso di teoria CS ad un prezzo adatto agli studenti e diventa pronto per l’industria.