La grève des employés de la SNCF est aussi une bataille de communication, dans laquelle chaque élément compte. Et au cours des dernières semaines, il a été fréquent de voir passer des représentations graphiques qui ne respectaient pas les règles élémentaires en la matière, qu’il s’agisse d’erreurs ou d’une volonté de présenter les choses sous un jour particulier. C’est donc l’occasion de revenir sur quelques manipulations ou erreurs classiques.
1. L’échelle distordue dans les « bâtons »
Ces bâtons, qu’on appelle aussi histogrammes, sont censés représenter des rapports de grandeur. Par exemple, pour quantifier le suivi de la grève sur plusieurs mois par les employés de la SNCF, la direction de l’entreprise a choisi cette représentation qui minore la participation :
Il aurait fallu privilégier une représentation s’appuyant sur un axe des ordonnées à zéro, comme ici :
Ce n’est par ailleurs pas la première fois que le service de communication de la SNCF joue avec la notion d’échelle pour minimiser le taux de participation des grévistes : un communiqué de presse diffusé le 4 avril utilisait les mêmes méthodes aux mêmes fins.
2. La courbe qui ne commence pas à zéro
Trois semaines avant les élections départementales de 2015, le Front national, voulant surfer sur la dynamique enclenchée lors des élections municipales et européennes, avait diffusé un tract trompeur montrant les (fortes) hausses des impôts et du chômage entre 2007 et 2013.
Sauf que l’axe des ordonnées ne commence pas à zéro, ce qui donne à la « pente » une courbe beaucoup plus forte qu’elle ne l’est en réalité. En outre, il manque deux années (notamment 2009, au cours de laquelle les prélèvements ont baissé à cause de la crise). Enfin, l’unité choisie est trompeuse car il est préférable de rapporter les montants à la production globale de richesse (le PIB).
En respectant tous ces critères, l’évolution des impôts sur la même période ressemblerait plutôt au graphique ci-dessous, beaucoup moins impressionnant :
On retrouve le même problème de distorsion de l’axe des ordonnées, avec la cote de popularité de Jean-Luc Mélenchon qui semble s’effondrer dans la représentation qu’en fait France 2 lors de la présidentielle de 2018 :
Il ne s’agit pas d’une règle absolue mais d’une convention ; les courbes devant montrer des chiffres négatifs (comme des températures) doivent évidemment commencer en dessous de zéro. Il peut en tout cas être utile au lecteur de se méfier de la « pente » d’une courbe et d’aller regarder le détail des données qui la compose.
3. Le « camembert » qui ne respecte pas les proportions
Toujours à propos de la grève à la SNCF, BFM-TV a récemment diffusé ce diagramme, critiqué sur les réseaux sociaux, où l’on peut voir que les 48 % d’opposition à la grève représentent plus de la moitié d’un camembert :
Selon CheckNews, l’erreur viendrait d’un problème de logiciel qui n’aurait pas réparti correctement les pourcentages. Voilà, ce qui aurait dû être diffusé :
Cela étant, un « camembert » est de toute façon un mauvais choix graphique pour représenter plus de trois valeurs : au-delà, l’œil ne distingue plus bien les volumes ni les angles des « parts ». Pour le professeur de statistiques et référence en « datavisualisation » Edward Tufte, un tableau vaut presque toujours mieux qu’un diagramme, faible en quantité de données et en ordonnancement de ces dernières.
4. Le graphique qui compare ce qui n’est pas comparable
Un graphique apparaissant sur Internet de façon récurrente veut montrer que les abus sexuels commis sur des enfants par des prêtres catholiques américains sont bien peu de chose, en nombre, par rapport à d’autres professions qui sont au contact d’enfants, par exemple les personnes travaillant dans l’enseignement.
Le graphique oppose des cas avérés d’abus sexuels reconnus par l’Eglise outre-Atlantique à des chiffres issus d’entretiens et de questionnaires, extrapolés pour les besoins de l’étude citée en source, qui mêle elle-même divers niveaux de gravité d’abus sexuels subis, du harcèlement au viol.
Sans compter que ces chiffres ne sont pas mis en perspective dans des cohortes comparables : il y a 80 fois moins de prêtres catholiques aux Etats-Unis que d’enseignants du secteur public.
5. Le graphique qui triche avec la base 100
Lors d’un des débats télévisés à la présidentielle de 2017, la candidate du FN, Marine Le Pen, brandit un graphique illustrant, selon elle, les conséquences de l’euro sur la production industrielle française. Il s’appuie sur des « vrais » chiffres mais les présente de façon exagérée, en trichant notamment avec la « base 100 ».
Prendre un indice 100 sur une année permet de comparer l’évolution de données relativement à cette année de base. La base vaut 100 et le reste des données évolue ensuite sur cette base. Exemple : avec une évolution positive de 4 %, l’année 2 affichera la valeur 104, une évolution de – 1 % vaudra 99.
Outre le fait que l’axe des ordonnées (vertical) ne commence pas à zéro, le graphique exacerbe l’idée que l’introduction de l’euro est « le » tournant dans la production industrielle en Europe, en prenant 2001 comme année de base de la comparaison, année d’introduction de la monnaie unique.
Si l’on prend les mêmes données comme elles sont présentées sur le site de l’OCDE, en prenant comme base 2010 cette fois, les courbes ne se croisent plus autour des années 2000, mais pendant la crise de 2009, dont l’Allemagne s’est mieux relevée que les autres pays. Il est donc trompeur d’affirmer, sur la seule base du premier graphique, que l’euro a fait plonger la production industrielle française en faveur de celle outre-Rhin.
6. La carte qui s’appuie sur des données brutes
Les cartes passionnent, même lorsque ce n’est pas nécessaire et qu’un graphique suffirait, ou quand elles ne montrent aucune tendance géographique (régionale, nationale…). C’est souvent le cas des cartes qui représentent des données brutes, sans les mettre en rapport avec la population. Comme cette « carte de France de la radicalisation » qui fait ressortir (malgré l’imbroglio des couleurs, sans gradation dans les teintes) les départements les plus peuplés, sans grande valeur informative :
Pour comparer des zones aux populations diverses sur une carte, il vaut mieux utiliser des taux ou des valeurs relatives. En statistiques, lorsqu’il s’agit de compter des cas, le plus commode est de rapporter un nombre à 10 000 habitants, ce qui donnerait ceci :
7. La projection cartographique qui distord les pays
Il n’y a pas de projection « vraie » ou « fausse », mais il y a une projection pour chaque usage. La plus utilisée actuellement, la projection Mercator, a ainsi été inventée pour faciliter les transports maritimes car elle conserve bien les angles et donc les caps. Mais elle déforme les distances et les surfaces.
Ce qui peut être avantageux si un Etat cherche à montrer son rayonnement ou, comme dans le cas de cette carte datant de 1938, pour accentuer un message – ici la mise en garde contre la « nouvelle peste noire », les Etats dictatoriaux.
Selon l’endroit dont on regarde le monde, on peut aussi véhiculer un message spécifique, comme dans cette perspective « vue de Moscou », où l’auteur cherche à montrer l’avancée inquiétante du communisme, ou dans cette autre, vue de Chine, qui affirme le pouvoir de l’empire sur le reste du monde, représenté dans les petites îles tout en haut à gauche de la carte.
Mise à jour le 22 mai à 17 h 35 : ajout d’une précision sur l’axe vertical des courbes.
Voir les contributions
Réutiliser ce contenu