(Québec) Depuis toujours, la base de la base élémentaire 101 des fondements primaires de la pierre d'assise sur laquelle repose le socle de toute science, c'est que si l'on veut que nos connaissances progressent, on doit pouvoir se fier aux résultats des expériences passées, on doit pouvoir construire dessus. Parce que si on ne peut pas partir de ces expériences-là pour guider de futures recherche, alors pourquoi on les fait ?

Mais un travers bien connu des milieux scientifiques est que, justement, la validation des résultats antérieurs est une tâche ingrate et peu valorisée. Personne, ou presque, n'obtient de subventions pour refaire les expériences des autres et très peu de revues savantes sont intéressées à les publier. Si bien que, dans bien des disciplines, on doit (trop) souvent se fier à des résultats qui n'ont été rapportés qu'une seule fois et n'ont jamais été reproduits. Du moins, pas dans la littérature scientifique. Certes, le concept de «résultats convergents» permet de contourner ce problème en partie - sans refaire exactement les mêmes expériences, on peut mener des recherches un peu différentes qui donnent des résultats cohérents avec ce qui a déjà été publié -, mais ce n'est pas idéal. Si bien que plusieurs initiatives de reproduction d'expériences qui ont «fait école» dans leur discipline ont été entreprises.

Et les résultats ne sont pas très glorieux, jusqu'à présent. En psychologie, une équipe a tenté de reproduire 100 expériences célèbres, mais n'a obtenu des résultats comparables que dans 39 % des cas. Des économistes ont voulu faire la même chose dans leur discipline, qui ne s'en est pas mieux tirée (49 %). Et voilà que le même exercice, entrepris en 2013 sur des études très citées en cancérologie, vient de livrer ses premières conclusions... qui ne sont pas plus reluisantes que les autres, rapport Nature. L'échantillon est encore petit, mais sur cinq expériences testées, seulement deux ont été reproduites «substantiellement». Les résultats de deux autres se sont avérés difficiles à interpréter (quelque chose s'est mal passé pendant la réplication, qui n'a pas pu être recommencée), et la cinquième réplication s'est bien déroulée mais n'a tout simplement pas obtenu les mêmes résultats que l'originale.

Remarquez, cela ne veut pas dire que les trois études non reproduites sont mauvaises. Mais cela signifie qu'il y a une foule de facteurs, souvent très anodins en apparence, qui peuvent influencer l'issue d'une expérience. Et c'est particulièrement vrai en recherche biomédicale, où des détails comme la température des labos, des différences d'éclairage entre deux parties d'une pièce où l'on garde des souris, etc., peuvent fausser les résultats. En fait, il semble que même le simple fait que l'expérience soit menée par un homme ou une femme peut faire une différence, c'est tout dire...

Une des principales conclusions de l'essai de réplication publié dans Nature est d'ailleurs qu'il n'y a pas assez de détails méthodologiques qui sont publiés dans les articles scientifiques. Et si on comprend mal comment ces détails peuvent influer sur le résultat d'une expérience, cela implique qu'on ne comprend pas (encore) bien ce que l'on étudie.

Histoire à suivre...