Data visualisation : quel graphique pour quel type de données ?

À l’ère du Big Data, les outils de data visualisation sont incontournables pour faire parler les données et exploiter tout leur potentiel. Mais comment choisir les graphiques les plus adaptés en fonction de vos objectifs et du message que vous souhaitez transmettre ?

Les principaux types de graphiques pour la visualisation de données

Un outil de visualisation des données peut prendre en charge une multitude de graphiques. Mais encore faut-il connaître leurs caractéristiques et leurs fonctions respectives.

Le diagramme en barres

Le diagramme à barres est une représentation graphique très utilisée pour comparer différents éléments. Un axe du diagramme montre les éléments comparés et l’autre axe représente la valeur mesurée. Simple à concevoir et à comprendre, il est particulièrement adapté lorsqu’il faut présenter de nombreuses catégories.

Ce type de graphique peut aussi être utilisé pour effectuer des comparaisons plus complexes,en groupant ou en empilant les barres.

Le diagramme à barres groupées contient au moins deux barres pour chaque groupe, possédant chacune un code couleur. Prenons l’exemple d’un chef d’entreprise souhaitant mesurer l’évolution du chiffre d’affaires de ses deux magasins. Il pourrait concevoir un diagramme à barres groupées, avec les mois de l’année sur l’axe horizontal, le chiffre d’affaires sur l’axe vertical et des barres de couleurs différentes pour représenter chaque point de vente.

Quant au diagramme à barres empilées, il consiste à superposer des barres représentant différents groupes. L’addition de ces barres représente quant à elle le total des différents groupes. À noter : le diagramme à barres empilées ne convient pas si certains groupes possèdent des valeurs négatives.

Bonnes pratiques

  • Placez les valeurs directement sur les barres pour faciliter la lecture.
  • Veillez à ajouter des étiquettes sur les axes pour apporter plus de contexte au lecteur.
  • De préférence, utilisez une seule couleur (sauf pour les diagrammes à barres groupées et empilées).


Le graphique en courbes

Le graphique en courbes permet de révéler des tendances et des évolutions dans le temps, mais aussi de montrer des relations au sein d’un ensemble de données continu. Il peut être utilisé dans de nombreuses situations, par exemple pour représenter l’évolution du trafic d’un site internet ou les variations des ventes d’un produit.

 

Bonnes pratiques

  • Les étiquettes des axes du graphique doivent être nommées clairement pour faciliter la compréhension.
  • Limitez autant que possible les éléments visuels distrayants (couleurs vives, légendes, quadrillage…) pour bien faire ressortir la tendance générale.
  • Le graphique ne doit pas comporter plus de 5 ou 6 courbes, afin d’éviter la surcharge visuelle.


Le graphique en secteurs

Aussi appelé diagramme circulaire ou camembert, le graphique en secteurs est très souvent utilisé pour montrer les différentes parties d’un tout. Chaque « part » représente une catégorie de données et sa taille est proportionnelle au pourcentage de la somme totale qu’elle représente.

Bonnes pratiques

  • Évitez de comparer trop de catégories à la fois pour garantir la lisibilité du graphique.
  • Si les parts sont de taille similaire, il peut être intéressant d’utiliser un graphique en barres ou un histogramme pour que la différence soit plus perceptible.

L’histogramme

L’histogramme permet de représenter la répartition des valeurs d’une variable continue sur une certaine période de temps. Pour chaque groupe, on construit une barre dont la base correspond aux valeurs et la hauteur correspond au nombre d’observations dans le groupe.

Par exemple, il est possible de représenter le nombre d’employés sur l’axe des ordonnées et les tranches de salaires sur l’axe des abscisses. Ainsi, l’histogramme permet d’avoir rapidement une vue d’ensemble de la rémunération des collaborateurs.

En outre, ce type de graphique est utile pour estimer la concentration des valeurs et identifier des écarts, des extrêmes ou des valeurs aberrantes. L’analyse de l’histogramme permet de se faire une idée claire sur la distribution des valeurs.

 

Bonnes pratiques

  • Évitez d’ajouter trop de couleurs différentes dans le graphique : utilisez plutôt des nuances d’une seule et même couleur. Néanmoins, il est possible de colorier une barre en particulier, que vous souhaitez mettre en avant dans votre analyse.

La carte proportionnelle

Aussi appelée treemap, la carte proportionnelle est une représentation graphique de données hiérarchiques. Visuellement, il s’agit d’un emboîtement de carrés et de rectangles dont la couleur et la taille varient selon la valeur associée. En général, la taille d’une case représente une quantité, tandis que sa couleur exprime une catégorie.

La carte proportionnelle est idéale pour identifier des tendances ou effectuer des comparaisons rapides, surtout si une couleur sort du lot. En outre, elle permet de condenser des centaines de milliers d’informations dans une représentation organisée occupant un espace restreint, ce qui facilite la compréhension.

Bonnes pratiques

  • Utilisez des couleurs vives et contrastées pour faire ressortir les différentes zones de la carte. Attention, toutefois, à ne pas surcharger le graphique.
  • Pour simplifier la lecture, attribuez une étiquette à chaque région de la carte.
  • Bien qu’une carte proportionnelle puisse contenir une multitude de cases, celles-ci ne doivent pas être trop nombreuses pour que la représentation reste compréhensible.


Le graphique en aires

Le graphique en aires se rapproche, sous certains aspects, du graphique en courbes. En effet, ils permettent tous les deux de montrer des évolutions dans le temps, des tendances générales et la continuité d’un ensemble de données. Toutefois, dans un graphique en aires, l’espace situé entre la courbe et les axes est coloré pour indiquer un volume.

Par exemple, un graphique en courbes est utile pour montrer l’évolution d’une population dans le temps. Le graphique en aires, quant à lui, permet de suivre cette évolution, mais aussi de représenter la population totale au fil des années.

En data visualisation, cette représentation est aussi utilisée pour comparer deux quantités ou plus, en affichant des totaux cumulés à l’aide de nombres ou de pourcentages : on parle alors de graphique en aires empilées.

Bonnes pratiques

  • Si vous possédez plusieurs ensembles de données et que vous souhaitez mettre en lumière les différences entre ces catégories, privilégiez le graphique en aires empilées.
  • Pour garantir une bonne lisibilité, évitez de comparer un trop grand nombre d’ensembles de données.

Le graphique radar

Le graphique radar est parfois nommé graphique en toile d’araignée de par son aspect : un polygone divisé par plusieurs rayons, sur lesquelles les valeurs des données sont représentées.

Le graphique radar est idéal pour effectuer des comparaisons entre plusieurs éléments, en se basant sur des données cycliques. Il est également très pratique pour mettre en lumière des différences, des similitudes ou encore des valeurs aberrantes. Il est plus adapté lorsque les ensembles de données sont de taille petite ou moyenne.

Bonnes pratiques

  • Le graphique en toile d’araignée doit inclure au moins trois variables, disposées dans un ordre significatif.
  • Pour éviter que le graphique devienne illisible, limitez le nombre de variables représentées.


Le nuage de points

Le nuage de points est souvent utilisé pour présenter les relations entre deux variables. Il est particulièrement utile lorsque les valeurs de la variable sur l’axe vertical dépendent des valeurs de la variable de l’axe horizontal. Dans ce type de graphique, les points sont placés sans être reliés. Ils montrent alors une tendance qui indique le type et la force de la relation entre les variables.

Le nuage de points peut être utilisé dans plusieurs objectifs : comprendre comment une variable influence l’autre, trouver des anomalies ou identifier une corrélation, une tendance ou un modèle.

Bonnes pratiques

  • Le nuage ​​de points se prête bien à la représentation d’une grande quantité de données. En effet, contrairement à d’autres graphes, il ne perd pas en clarté même s’il contient un volume important d’informations.
  • Pour mettre en valeur les données les plus pertinentes et faciliter la lecture, il est possible de faire varier la taille et la couleur des points.


Le graphique en bulles

Le diagramme à bulles est une variante du nuage de points. Ici, les points sont remplacés par des bulles, dont la taille représente une dimension supplémentaire des données. Ainsi, le graphique à bulles est très utile pour identifier des corrélations entre plusieurs variables. Chaque bulle correspond à une catégorie, qui a plus ou moins d’importance selon sa taille et sa position sur le graphique.

Bonnes pratiques

  • Utilisez des couleurs différentes pour distinguer les catégories, tout en utilisant la transparence pour mettre en avant les relations entre elles.
  • Limitez le nombre d’éléments à analyser pour ne pas perdre en lisibilité.


Le graphique en cascade

Un graphique en cascade permet de représenter un total cumulé, à mesure que des valeurs sont additionnées ou soustraites. Il est très utile pour comprendre comment une valeur initiale est affectée par d’autres valeurs, qu’elles soient positives ou négatives. Ainsi, le diagramme en cascade sert à mesurer un indicateur (KPI), tout en analysant les facteurs positifs et négatifs qui ont un impact sur lui.

Pour illustrer, on peut imaginer : 

  • une première colonne représentant les ventes de marchandises, 
  • une seconde représentant le coût d’achat des marchandises,
  • et une troisième représentant la marge brute. 

Le graphique en cascade permet donc de visualiser la marge, mais aussi les éléments qui la composent (ventes de marchandises – coût d’achat).

 

Comment choisir le bon graphique pour la data visualisation ?

Pour visualiser des données à l’aide d’un outil de data visualisation, le choix d’un graphique adapté est essentiel. 

Que vous souhaitiez piloter votre stratégie marketing avec la data, suivre votre performance commerciale ou évaluer votre santé financière, vous allez devoir trouver la représentation idéale pour atteindre vos objectifs.

Pour ce faire, plusieurs critères doivent être pris en compte :

  • Le contexte : quel est l’objectif de la dataviz et à quel public sera-t-elle présentée ? Que souhaitez-vous montrer ?
  • La nature des données : s’agit-il de données financières, géographiques, socio-démographiques, commerciales ?
  • L’objectif de la data visualization : que voulez-vous mettre en lumière grâce à l’analyse des données ? Il peut s’agir d’une évolution dans le temps, d’un classement, d’une distribution, d’une corrélation ou encore d’une comparaison.

De manière générale, les représentations graphiques peuvent être classées dans quatre grandes catégories, en fonction de ce que vous souhaitez montrer.

La comparaison

Comme leur nom l’indique, les graphiques comparatifs sont utilisés pour comparer un ou plusieurs ensembles de données, mais aussi pour mettre en évidence des différences dans le temps.

  • Pour une comparaison entre plusieurs éléments, on utilise essentiellement le diagramme à barres. Si l’on souhaite comparer de nombreuses catégories différentes, on peut également utiliser un tableau contenant plusieurs graphes.
  • Pour une comparaison dans le temps, on privilégie le graphique en courbes, mais le diagramme en barres peut aussi être utilisé.

La relation

Les graphiques de cette catégorie servent à montrer une connexion ou une corrélation entre deux variables ou plus.

La représentation utilisée dépend principalement du nombre de variables :

  • Le nuage de points est idéal pour représenter deux variables.
  • Le graphique en bulles permet, quant à lui, de visualiser trois variables.

La distribution

Ces graphiques permettent d’identifier des tendances ou des anomalies, en montrant comment les variables sont distribuées dans le temps.

Là encore, le choix du graphe dépend du nombre de variables :

  • Pour une seule variable, on optera pour un histogramme ou une courbe.
  • Pour deux variables, le nuage de points est le plus approprié.

La composition

Les graphiques de composition sont utilisés pour afficher les parties d’un tout à l’instant T ou pour suivre leur évolution dans le temps.

  • Pour une représentation statique, on utilise le graphique en secteurs, le diagramme en cascade ou encore la carte proportionnelle.
  • Pour des données évoluant dans le temps, le diagramme à barres empilées et le diagramme en aires sont les plus adaptés.

En cas de doute, cette petite infographie vous aidera à trouver rapidement la meilleure représentation graphique pour vos données et à devenir une entreprise data driven : 

 

 

Désormais, vous avez toutes les cartes en main pour choisir les types de graphiques les plus adaptés à vos données et raconter des histoires captivantes avec vos data visualisations. Il ne vous reste plus qu’à les réunir dans un tableau de bord dynamique pour piloter votre performance et améliorer votre prise de décision au quotidien. 

La solution de Business Intelligence DigDash Enterprise vous permet de concevoir des dashboards sur mesure, simples d’utilisation et adaptés à vos spécificités métiers, avec des graphiques esthétiques et compréhensibles par toute votre équipe.