Pneumologie
Résultats statistiques et signifcation clinique : faire le deuil d’une certitude
Une réflexion sur la signification statistique et la signification clinique dans les études d'oncologie thoracique a été menée et a montré une distorsion entre des résultats statistiquement intéressants et ces mêmes résultats qui ne le sont pas cliniquement. D’après un entretien avec Bruno FALISSARD.
Un article, paru en novembre 2020, dans le Journal of Thoracic Oncology, a fait le point sur la controverse entre les résultats des études qui peuvent être significatifs statistiquement et qui ne le sont pas cliniquement, et inversement. La conception statistique et l’interprétation des résultats doivent donc être parfaitement maîtrisées pour comprendre pleinement cette controverse, fréquente, notamment en cancérologie thoracique.
Retourner aux origines des tests statistiques
Le professeur Bruno FALISSARD, pédopyschiatre à l’hôpital Robert Debré à Paris et professeur de biostatistiques, souligne l’incompréhension fréquente qui existe entre les résultats statistiques d’une étude et les résultats de son application clinique. Il précise que cet article manque d’une vision épistémologique. Selon lui, de bonnes statistiques ne font pas un bon médicament. Bruno FALISSARD rappelle que l’origine des tests statistiques remonte à Fisher, en 1922, alors que la question de savoir dans quelle mesure le tirage au sort pouvait expliquer les différences se posait. Ceci est à l’origine de la création de « p », qui est très souple et qui n’a rien à voir avec l’efficacité clinique. Bruno FALISSARD précise : « Dans quelle mesure le hasard peut-il expliquer ce que je vois ? La conclusion apprttient à celui qui écrit l’article ». Depuis la deuxième moitié du XXème siècle, ce type d’épistémologie physiopathologique n’a plus cours car la pensée biologique n’est pas la même que la pensée probabiliste de Fisher, ce qui a abouti à un mésusage du test statistique lorsque l’on dit que si p est inférieur à 5%, alors un médicament est efficace.
Besoin de dire « on a prouvé »
Bruno FALISSARD explique qu’il est absurde de penser qu’un médicament fait la preuve de son efficacité si p est inférieur à 5%. Il rappelle que les tests statistiques n’ont pas été faits pour cela, ce qui a engendré des quiproquos avec des résultats statistiquement intéressants mais pas cliniquement. La distorsion de l’usage original de p a servi à prouver des hypothèses face à la nécessité de dire « on a prouvé ». Or, en statistiques, on en peut pas prouver et Bruno FALISSARD insiste surle fait qu’il faut faire le deuil de cette pseudo-certitude.
En conclusion, cette controverse s’arrêtera lorsque l’on aura compris que le test statistique ne sert qu’à dire que le hasard peut être à l’origine des résultats…