Comment éviter des erreurs de prédiction

En un clin d'œil

Contrairement à ce que l’on pense souvent, le fait que deux variables soient “fortement corrélées” ne démontre pas qu’il y ait une relation de causalité entre l’une et l’autre. Et pourtant, de nombreuses prédictions marketing ou d’analyses stratégiques partent de cette confusion.

La rigueur méthodologique qu’exige la recherche en sciences de gestion permet de bien faire la distinction et d’éviter des erreurs graves aux analystes ou aux managers quand ils doivent décider.

L’Intelligence artificielle peut se tromper

L’Intelligence Artificielle est coutumière des erreurs d’analyse. Un exemple fameux est celui des situations de rejets ou de discriminations dans les recrutements. Ainsi, indiquer comme loisir dans son CV la pratique du ping pong amène le postulant à entrer dans la case des Asiatiques, alors que le tennis le renvoie à la catégorie des Européens … Certes beaucoup d’asiatiques jouent au ping pong comme beaucoup d’Européens jouent au tennis, mais ce n’est pas parce qu’on joue au ping pong ou au tennis qu’on est asisatique ou européen.

L’Intelligence Artificielle, mal programmée, ne peut donner que des conclusions tronquées. Il y a bien sûr les biais de perception des concepteurs des algorithmes comme cela a été mis au jour dans le cas d’une discrimination vis-à-vis des femmes, les auteurs étant essentiellement des hommes.

L’autre biais pointe la confusion entre la corrélation et la cause. Cette confusion a un nom : l’ « effet cigogne ».

L’effet cigogne : un exemple de confusion entre cause et causalité

Nous avons tous entendu dire que ce sont les cigognes qui amènent les bébés dans les foyers ? Mais d’où vient ce qui est (j’espère ne pas vous décevoir …) une belle légende ?

Cette histoire vient d’une croyance alsacienne : celles que les cigognes sont associées à la natalité, et que plus il y a de cigognes plus il y a de naissances dans la région dans laquelle elles se sont installées.

En effet, jusqu’à l’arrivée de la contraception généralisée, le pic des naissances se situaient au printemps, période de l’année où les cigognes arrivent en Alsace. En s’arrêtant à la concomitance des évènements, la conclusion est que les cigognes sont la cause de la multiplication des naissances à ce moment de l’année ! CQFD ! Mais, dans la réalité, les mariages ayant lieu en règle générale à la belle saison, les bébés sont conçus en été et naissent 9 mois après … au printemps.

Il y a coïncidence, corrélation, mais pas causalité !

Les définitions de cause et de corrélation

Nous pouvons proposer les définitions suivantes :

  • Une causalité est un lien qui affirme qu’une variable agit sur une autre.

Par exemple, on peut affirmer que l’augmentation du nombre de cigarette fumées entraine une diminution de l’espérance de vie, il y a causalité.

  • une corrélation est un lien statistique entre deux variables sans qu’on se demande quelle variable agit sur l’autre. La corrélation est positive quand les deux variables varient dans le même sens : lorsqu’une augmente, l’autre augmente aussi. La corrélation est négative quand les deux variables varient dans le sens opposé : lorsqu’une augmente, l’autre diminue.

Contrairement à ce que l’on pense souvent, le fait que deux variables soient “fortement corrélées” ne démontre pas qu’il y ait une relation de causalité entre l’une et l’autre.

Des exemples célèbres de mauvaises conclusions

Les exemples sont très nombreux et certains peuvent prêter à rire.

Ainsi s’appuyer sur une corrélation positive entre l’utilisation de crème solaire et l’apparition d’un cancer de la peau pour en déduire que les crèmes solaires sont la cause de ces cancers serait une interprétation fausse de la corrélation. Ce serait oublier que crème solaire implique exposition au soleil et donc risque plus élevé de cancer de la peau.

On peut ainsi citer la fameuse affirmation de la baronne Susan Greenfield, célèbre psychologue britannique, qui affirma : “Je remarque d’un côté la montée de l’autisme et de l’autre l’usage d’internet. C’est tout”. Tellement absurde que l’hashtag #greenfieldism, est apparu sur twitter avec des affirmations telles que : “Je remarque d’un côté le diabète et de l’autre les chats. C’est tout”. “Je remarque le réchauffement global et de l’autre le porno. C’est tout.”

Mais reconnaissons que cela peut aussi induire des soupçons qui, sans prise de recul peuvent faire beaucoup de mal et produire des rumeurs destructrices.

Un antidote aux confusions  : la zététique,

La zététique se définit comme : “l’étude rationnelle des phénomènes présentés comme paranormaux, des pseudosciences et des thérapies étranges”.

Son premier commandement est de : “ne pas prendre pour argent comptant tout ce que l’on veut bien nous dire, se donner du recul et, surtout, ne pas se priver de poser des questions, même si elles dérangent.”

La pratiquer régulièrement pour éviter d’être victime de l’ « effet cigogne » semble être une saine recommandation !

Vous pourrez aimer des billets sur des thèmes proches :

Ne pas confondre attitude et comportement

La méthode des 6 chapeaux de Bono

Vous pouvez aussi regarder la vidéo :