Représenter des données sur une carte, ça pose pleins de problèmes. Et on va pas faire en faire un tour exhaustif, mais on va s’attacher à un exemple, puis en pointer quelques autres.
Et pour démarrer, on va regarder la manière dont Le Monde.fr représentait au 27/03 les cas par régions en France, en faire l’analyse, et construire d’autres cartes.
Carte des cas confirmés de covid-19 par régions
version Le Monde au 27/03/20
Intérêts
– On sait combien de cas sont recensés dans chaque régions.
Limites :
– La taille/l’aire des cercles est proportionnel au doigt mouillé de celle/celui qui l’a fait
– Ça représente les cas, en faisant fi de la population des régions, donc on ne se rend pas compte de l’impact. Ce que ça implique, c’est que si il y a 344 000 cas en Corse, c’est 100 % de la population qui est touchée. S’il y en a autant en Île de France, c’est 2,8 % de la population ! C’est pas la même, gros.
Carte des cas confirmés de covid-19 pour 10 000 hab par régions.
Version Groupe Zététique le 27/03/20
Intérêts
– Les mêmes données sont utilisées
– Le diamètre des cercles est réellement proportionnel aux données représentées
– C’est nous qu’on l’a faite.
Limites :
– Il faudrait probablement que ce soit l’aire qui soit proportionnelle.
– Représenter les « cas », comme dans la précédente c’est un peu d’la merde mais c’est pas la question (on verra ça plus tard).
Carte des cas confirmés de covid-19 pour 10 000 hab par régions.
Version Groupe zététique le 27/03/20
Intérêts
– Les mêmes données sont utilisées
– Les aires des cercles sont proportionnelles aux données représentées, c’est à dire que la surface recouverte par le cercle du Grand Est est 9,9 fois plus grande que celle des Pays de la Loire.
Limites :
– Cette carte représente les cas, comme les deux précédentes. Or, cette donnée est très dépendante de la politique de diagnostic. Cette donnée reste néanmoins exploitable si la politique de diagnostique est homogène sur le territoire qu’on considère.
Cette dernière manière de représenter cette donnée nous semble plus fidèle: elle rend compte de l’impact (au sens du nombre de cas diagnostiqués) de l’épidémie dans chaque région, et le représente de manière proportionnelle. Lorsqu’on veut rendre compte de la disparité d’un phénomène selon les territoires, il est trompeur de ne pas rapporter le nombre de cas qu’on recense à la population de la région en question. Le plus déroutant, c’est que lemonde.fr reproche justement au FN de le faire pour la dite « radicalisation islamiste », mais le font pour le covid-19 sur leur carte du monde, et sur leur carte des régions pour la France.https://www.lemonde.fr/les-decodeurs/article/2018/05/22/sept-conseils-pour-ne-pas-se-faire-avoir-par-les-representations-graphiques_5302680_4355770.html
Quelques autres enjeux autour de la représentations des données en carte:
– Le choix du titre oriente la lecture qu’on a du document : de nombreux médias présentaient des cartes du monde recensant les « cas de Covid-19 », alors qu’il ne s’agissait que des cas diagnostiqués. Or, il y’a une grande variabilité selon les pays quant aux capacités et aux choix en matière de politique de diagnostique. Pour grossir le trait, si l’on ne test personne sur un territoire, on a aucun cas dans ce territoire. Le choix de ce titre a été corrigé depuis par certains médias, qui signalent qu’il s’agit des cas détectés dans le titre ou la légende.
– Le choix des couleurs : Si l’on représente le nombre de mort.es par pays par un dégradé de 5 couleurs, on décide alors des seuils de chaque couleur. Par exemple -de 10 mort.es / 10-100 mort.es / 100-1000 mort.es / 1000-5000 mort.es/ + de 5000. Ce choix est arbitraire, et on peut en faire d’autres. Mais cela change la lecture que l’on a de la situation ! Par exemple, ce choix exclue la France, l’Iran et la Chine des pays les plus touchés (et peut, peut être, amener à relativiser la situation dans ces pays). Si l’on contraire on veut montrer que la situation en France est dramatique, on décide que le dernier seuil est « + de 2000 mort.es », et hop, magie, la France apparaît au même titre que l’Italie et l’Espage dans les pays les plus touchés. Il est compliqué de dire qu’il y’a un bon choix pour représenter ces données, mais il y en a sûrement de moins mauvais que d’autres, et il y a souvent des présupposés politiques.
– On présuppose toujours, quand on lit une carte, que les symboles qui représentent les données (flux migratoire, densité de population, etc…) sont proportionnels entre eux. Eh bien pas toujours ! Parce que c’est pénible à faire, parce que les différences ne sont pas toujours lisibles quand elles ne sont pas exagérées, ou parce que Jean-Michel Raciste veut nous faire croire qu’on est envahis: dans tous les cas, cela peut biaiser considérablement la lecture que l’on a d’un phénomène !
– Choisir de représenter une donnée, c’est souvent choisir de ne pas en représenter d’autres. Comme choisir de dire quelque chose, c’est choisir de ne pas parler d’autre chose.
Allez, et un bon plan pour la route: en terme de carte qui représente l’impact de l’épidémie, on invite les curieux.ses à jeter un œil à celle-ci.
Cette page fait apparaître, département par département, le nombre de personnes hospitalisées pour le Covid-19, le nombre de personne en réanimation, et le nombre de places en réanimation. Ces indicateurs donnent une bonne idée de la saturation des services de santé.
PS: On notera que depuis la rédaction de cet article, lemonde.fr a changé sa carte des régions, illes y mettent maintenant le nombre de personnes hospitalisées par région.
1 Pingback