Article technique

Focus sur le score de propension

21/03/2022

Lors de certaines études prises en charge par Soladis by Efor, il est parfois nécessaire de faire appel à un calcul de « score de propension ».

Quelle est cette démarche, et quand et pourquoi y fait-on appel ?

Lorsque l’on souhaite tester l’efficacité d’un nouveau traitement, on veut obtenir une estimation de son effet la moins biaisée possible. Pour ce faire, cette estimation doit être réalisée sur des groupes dits « comparables », qui ne diffèrent “que” par le traitement pris, et non pas par des caractéristiques individuelles de sujets de l’étude.

Prenons l’exemple d’un cas où les groupes ne sont pas comparables sur le stade de la maladie : si les patients du groupe traitement sont plus gravement atteints, cela peut influer sur l’estimation de l’effet traitement, et l’on pourrait conclure à tort que le traitement n’est pas efficace. C’est pourquoi la plupart des essais cliniques sont randomisés : l’attribution aléatoire permet d’obtenir des groupes comparables sur tous les facteurs (mesurés et non mesurés).

Malheureusement, les essais cliniques randomisés ne sont pas toujours possibles à mettre en place (coût élevé ; attribution du traitement par tirage au sort posant un problème d’éthique etc), comme dans le cas d’études observationnelles. Lors d’études de ce type, les investigateurs n’ont pas le contrôle sur l’attribution du traitement qui est souvent influencée par les caractéristiques des patients à baseline. Cela implique donc potentiellement des groupes de patients déséquilibrés sur les variables observées et non observées. Les groupes sont alors « non-comparables », et cela induit un biais dans l’estimation de l’effet traitement (biais de sélection).

La méthode du score de propension peut alors être utilisée pour pallier à ce problème.

Le score de propension est en fait une étape préalable à l’estimation de l’effet traitement. Il est calculé pour chaque individu de l’étude et représente la probabilité du patient à recevoir le traitement sachant ses caractéristiques à l’entrée dans l’étude. L’estimation du score se fait majoritairement à l’aide d’une régression logistique. C’est l’allocation du traitement (variable représentant le groupe) que l’on cherche à expliquer en fonction des caractéristiques à baseline des patients. Lors de cette étape de calcul, les covariables à baseline ne sont néanmoins pas toutes à inclure d’office dans le modèle ; malgré un manque de consensus dans la littérature, il est conseillé d’inclure les covariables qui sont à la fois liées au critère de jugement de l’étude et à l’allocation du traitement (vrais facteurs confondants) et/ou celles liées seulement au critère de jugement.

La méthode du score de propension est applicable sous certaines conditions/hypothèses (tous les vrais facteurs confondants doivent être mesurés ; l’allocation du traitement est fortement “ignorable” conditionnellement aux covariables à baseline ; l’allocation du traitement est indépendante d’un patient à l’autre). Lorsque ces hypothèses sont vérifiées, alors deux patients de groupe différents ayant le même score de propension sont considérés comme « pseudo-randomisés » : leur attribution du traitement ressemble à un tirage au sort.

Une fois le score de propension estimé pour chaque patient, il existe plusieurs méthodes d’utilisation du score de propension : l’appariement/matching, la stratification, la pondération inverse ou encore l’ajustement sur le score de propension. Le choix de la méthode dépend de l’objectif de l’étude (estimer l’effet traitement dans la population traitée (Average treatment effet on the treated ATT) ou dans la population globale (Average treatment effect ATE)).

Afin de vérifier si le score de propension équilibre bien les caractéristiques des patients entre les groupes, il est souvent calculé pour chaque covariable la différence standardisée de leur moyenne ou prévalence entre les deux groupes. Il est aussi nécessaire d’étudier les moments d’ordre plus élevé (ratio de variance, QQ plots etc). On peut aussi étudier les différences standardisées sur les interactions entre les covariables.

Il est possible que l’équilibre des covariables les plus importantes ne soit pas atteint après l’application du score de propension. Si c’est le cas, le score de propension peut être rééstimé en introduisant des interactions ou des facteurs polynomiaux sur les variables dans le modèle ; cette méthode est itérative et peut être répétée à plusieurs reprises tant que l’équilibre n’est pas atteint. Si en dépit de toutes ces étapes l’équilibre n’est toujours pas obtenu, il est possible de conclure que les groupes ne sont tout simplement pas comparables.

Avant de valider ces calculs, la mise en place d’une analyse de sensibilité est recommandée pour vérifier qu’il ne manque pas de facteur confondant.

Un fois l’étape du score de propension terminée, il est important de prendre en compte la nature de la méthode utilisant le score de propension lors de l’estimation de l’effet traitement par l’analyse statistique. En effet, si on prend l’exemple du matching, les deux échantillons (groupe traitement et groupe contrôle) ne sont pas indépendants puisqu’un ou des individus traités sont associés à un ou des individus non traités sur leur ressemblance en termes de caractéristiques à baseline. Il existe donc une corrélation à prendre en compte lors de l’estimation de l’effet traitement.

Nos équipes se tiennent à votre disposition pour répondre à vos questions et vous accompagner sur ces sujets

N’hésitez pas à solliciter nos équipes via le formulaire de contact


Références :

P. R. Rosenbaum et D. B.Rubin, «The central role of the propensity score in observational studies for causal effects,» Biometrika, 1983.

P. C. Austin, «An Introduction to Propensity Score Methods for Reducing Effects of Confounding in Observational Studies,» Multivariate Behavioral Research, 2011.

Gayat et Porcher, «Comparaison de l’efficacité de deux thérapeutiques en l’absence de randomisation : intérêts et limites des méthodes utilisant les scores de propension,» Réanimation, 2012.

R. E. Lanehart, P. R. d. Gil, E. S. Kim, A. P. Bellara, J. D. Kromrey et a. R. S. Lee, «Propensity score analysis and assessment of propensity score approaches usign SAS procedures,» SAS Global Forum – Statistics and Data Analysis. Paper 314-2012, 2012.

E. A. Stuart, «Matching methods for causal inference: A review and a look forward,» Statistical science: a review journal of the Institute of Mathematical Statistics, vol. 25, n° %11, p. 1, 2010.