1. Données univariées –
Ce type de données est constitué d’une seule variable. L’analyse des données univariées est donc la forme d’analyse la plus simple puisque l’information porte sur une seule quantité qui change. Elle ne traite pas des causes ou des relations et l’objectif principal de l’analyse est de décrire les données et de trouver les modèles qui existent en leur sein. L’exemple d’une donnée univariée peut être la hauteur.
Supposons que les hauteurs de sept élèves d’une classe soient enregistrées(figure 1),il n’y a qu’une seule variable qui est la hauteur et elle ne traite d’aucune cause ou relation. La description des modèles trouvés dans ce type de données peut être faite en tirant des conclusions en utilisant des mesures de tendance centrale (moyenne, médiane et mode), de dispersion ou d’étalement des données (étendue, minimum, maximum, quartiles, variance et écart type) et en utilisant des tableaux de distribution de fréquence, des histogrammes, des diagrammes circulaires, des polygones de fréquence et des diagrammes à barres.
2. Données bivariées –
Ce type de données implique deux variables différentes. L’analyse de ce type de données traite des causes et des relations et l’analyse est faite pour découvrir la relation entre les deux variables.Exemple de données bivariées peut être la température et les ventes de crème glacée en saison estivale.
Supposons que la température et les ventes de crème glacée sont les deux variables d’une donnée bivariée(figure 2). Ici, la relation est visible à partir du tableau que la température et les ventes sont directement proportionnelles l’une à l’autre et donc liées car lorsque la température augmente, les ventes augmentent également. L’analyse des données bivariées implique donc des comparaisons, des relations, des causes et des explications. Ces variables sont souvent tracées sur les axes X et Y du graphique pour une meilleure compréhension des données et l’une de ces variables est indépendante tandis que l’autre est dépendante.
3. Données multivariées –
Lorsque les données impliquent trois variables ou plus, elles sont classées dans la catégorie multivariée. Exemple de ce type de données : supposons qu’un annonceur veuille comparer la popularité de quatre publicités sur un site Web, alors leurs taux de clics pourraient être mesurés pour les hommes et les femmes et les relations entre les variables peuvent alors être examinées.
Ce type de données est similaire aux données bivariées mais contient plus d’une variable dépendante. Les moyens d’effectuer une analyse sur ces données dépendent des objectifs à atteindre.Certaines des techniques sont l’analyse de régression,l’analyse de chemin,l’analyse factorielle et l’analyse de variance multivariée (MANOVA).
Attention lecteur ! N’arrêtez pas d’apprendre maintenant. Mettez la main sur tous les concepts importants de la théorie CS pour les entretiens SDE avec le cours de théorie CS à un prix adapté aux étudiants et devenez prêt pour l’industrie.