Représentation graphique de l'information
Je le dis à mes étudiants en C2i : chaque fis que quelqu'un utilise une forme de graphique non-standard, il y a une forte chance pour qu'il essaye de vous tromper sur la signification de ce qu'il représente. Les graphiques publiés par J.P. Morgan et repris dans ce billet d'Éconoclaste en sont une parfaite illustration.
Erratum : il y avait une erreur d'analyse dans ce que j'ai fait, relevée par un commentateur. J'ai donc corrigé mon billet (le 17/12/2009, mieux vaut tard que jamais).
L'idée est simple : on représente la capitalisation boursière des grands groupes bancaires en 2007 et aujourd'hui. Normalement, il faudrait faire un bête histogramme. Seulement, les gens de J.P. Morgan ont utilisé des cercles pour représenter cela. L'arnaque commence quand c'est le diamètre des cercles qui est proportionnel à la capitalisation. Or, ce que le cerveau humain retient, c'est l'aire des disques représentés. Ainsi, si la capitalisation boursière d'un banque en 2009 est la moitié de ce qu'elle était en 2007, elle apparaît comme un cercle quatre fois plus petit.
C'est d'autant plus trompeur que l'écart entre la hauteur et la surface n'est pas linéaire, mais quadratique : ainsi que l'illustre le graphique ci-dessous, soit C la capitalisation en 2007, et a.C la capitalisation actuelle (0<a<1). Le rapport entre les deux capitalisations est a (droite bleue), et celui entre les aires des disques qui la représentent est a^2 (courbe rouge). Cette différence est maximale pour les grandes valeurs, c'est-à-dire pour les banques qui ont le plus perdu en proportion.
Que cela dit-il pour le graphique qui nous intéresse ? Eh bien on voit que J.P. Morgan ne cherche pas par là à se mettre en valeur, puisqu'ils sont dans la zones où l'écart entre les deux est le plus défavorable. Cette erreur, grossière, est donc à mettre sur le compte de la pure incompétence plutôt que sur celui de la manipulation.
C'est ici que je me suis planté. En fait, le graphique met effectivement en valeur JP Morgan, qui a relativement peu perdu en proportion, en exagérant l'étendue des pertes des autres banques.
Ci-dessous, le graphique tel qu'il aurait dû être : deux histogrammes juxtaposés, en utilisant la juxtaposition pour donner une information supplémentaire (en l'occurence, les banques sont rangées par ordre croissant de rapport entre leur capitalisation ancienne et leur capitalisation actuelle, mais on aurait aussi pu les ranger par ordre de capitalisation actuelle). En bonus, j'ai indiqué les rapports en question, ainsi que le carré des rapports (soit le rapport entre la surface des disques).
Le même graphique en rangeant les banques par capitalisation initiale fait apparaître en outre que le rapport entre capitalisation en 2009 et capitalisation en 2007 est très probablement indépendant de la capitalisation initiale : les gros n'ont pas proportionnellement plus ou moins perdu que les petits. Il y avait donc beaucoup mieux à faire avec cette série de données que le graphique initial.
Mise à jour : il paraîtrait que la version ci-dessus serait une version préliminaire malencontreusement publiée. En tout état de cause, JP Morgan a rapidement proposé un graphique formellement plus correct (ci-dessous). J'en profite pour signaler à ceux qui ne le connaissent pas encore le passionnant Eward Tufte qui a donné ses lettres de noblesse à la représentation graphique de l'information.
Publié le jeudi, janvier 22 2009, par Mathieu P. dans la catégorie : Réactions - Lien permanent
Commentaires
jeudi, janvier 22 2009
20:13
Je ne suis pas sur pour l'incompétence.
— SkavMa lecture personnelle du graph initial : JP Morgan est désormais presque le plus gros, mais par contre il a beaucoup moins fondu que le premier, HSBC, opportunément mis à côté. Santander par contre est éloigné par la vache bleue citigroup.
Ce qui nous amène à la deuxième entourloupe, l'ordre des banques, qui ne me paraît suivre aucune logique défendable.
Notons aussi que JP Morgan est écrit en gras, et, me semble-t-il, dans une taille de police plus grande.
Bien sur on passera sur les différences monumentales de périmètre des banques entre 2007 et aujourd'hui, et l'oubli malencontreux d'un certain nombre. Par exemple uk.reuters.com/article/ma...
jeudi, janvier 22 2009
23:15
C'est corrigé, apparemment ça a déclenché "the mother of all buzz"
— acidtestftalphaville.ft.com/blog/...
vendredi, janvier 23 2009
12:45
La représentation par histogramme gagne à tracer des rectangles dont la base est proportionnelle à la taille de la banque. Par exemple,
— thomas pathimg171.imageshack.us/img1...
mercredi, février 4 2009
20:43
Intéressant, ce truc sur le cerveau qui percevrait plutôt les aires que les tailles des cercles. Vous auriez sous la main une ou deux références là-dessus?
— Enervé de servicejeudi, février 5 2009
09:21
Je peux essayer de ressortir mon cours de sciences congnitives, mais il est au fond de ma cave en ce moment... Sinon, je pense qu'un survol du travail d'Edxard Tufte devrait fournir les pointeurs nécessaires (et largement plus d'ailleurs). C'est d'ailleurs des fora de ce site qu'est parti le buzz au sujet de ces graphiques.
— Mathieu P.mercredi, avril 1 2009
11:47
C'est gentil de parler d'incompétence de JP Morgan, mais l'incompétence est plutôt du côté de Mathieu P. ;)
— jimiEn effet, il y a une petite erreur (plus subtile que la relation diamètre - aire, certes) dans le choix des bornes dans le graphique de la fonction x² (entre 0 et 1). Avec ces bornes, on peut laisser croire que l'erreur maximale correspond à la perte de 50%. Mais il n'y a pas besoin d'avoir fait des études en sciences cognitives pour voir qu'en réalité, la différence entre les deux graphiques est la plus grande dans les cas de citigroup et de la Banque Royale d'Ecosse, non ?
Tout ça parce que c'est le rapport "taille en 2007" / "taille en 2009" qui doit être pris en compte et non l'inverse. Du coup, la fonction x² doit être prise entre 1 et ... 26 ! (le plus grand rapport "taille en 2007" / "taille en 2009", pour RBS : 120/4.6) Après, je laisse le soin de retracer les courbes dans cet intervalle, et on voit bien après que l'écart le plus important est pour les banques qui ont pris le plus cher : l'effet recherché par JP Morgan était donc atteint !
mercredi, avril 1 2009
12:07
Cette question de x^2 m'a turlupiné quand j'ai fait le graphique, sans que j'arrive à mettre le doigt dessus. Cela marche effectivement mieux en prenant le rapport dans l'autre sens. Il n'en reste pas moins que la représentation initiale de JP Morgan ne respectait pas la proportionnalité entre ce rapport et l'aire des disques représentés, comme le montre leur graphique corrigé.
— Mathieu P.