ANALYSE CRITIQUE ET INTERPRÉTATION DES ESSAIS … · LECTURE ET ANALYSE CRITIQUE DES ESSAIS...

102
LECTURE ET ANALYSE CRITIQUE DES ESSAIS CLINIQUES Dr. Emmanuel Amsallem CETAF, Responsable service Qualité Évaluation Études [email protected]

Transcript of ANALYSE CRITIQUE ET INTERPRÉTATION DES ESSAIS … · LECTURE ET ANALYSE CRITIQUE DES ESSAIS...

LECTURE ET ANALYSE CRITIQUE

DES ESSAIS CLINIQUES

Dr. Emmanuel Amsallem

CETAF, Responsable service Qualité – Évaluation – Études

[email protected]

OBJECTIFS

Connaitre la finalité de l’évaluation de l’efficacité

d’une stratégie de prise en charge (traitement,

prévention, dépistage, etc.) ?

Connaitre les grands principes de l’essai randomisé

Savoir cibler l’interprétation sur l’intérêt en pratique

clinique pour la prise de décision médicale

Analyse critique : approche du point de vue de l’utilisateur

(médecin)

Savoir apprécier le bénéfice et le risque pour le

consultant

Pourquoi la lecture critique ?

LA LECTURE CRITIQUE

Pré-test

A quoi cela sert-il ?

Comment s’y prendre ?

LA LECTURE CRITIQUE

Le problème

Existe-t-il des preuves fiables qu’une stratégie de prise

en charge (traitement, prévention, dépistage, etc.)

apportera en pratique un bénéfice suffisant et pertinent

au patient, et supérieur au risque encouru ?

LA LECTURE CRITIQUE

Les questions

Validité interne du résultat d’une étude ?

Le résultat est-il réel ?

Le résultat est-il non biaisé ?

Pertinence clinique et représentativité ?

Bénéfice intéressant en pratique ?

Extrapolable à nos patients ?

Cohérence externe ?

Concordant avec d’autres connaissances ?

LA LECTURE CRITIQUE

Les sources d’informations

Primaire

Rapport publié de l’essai

Secondaires

Collègues

Livres

Recommandations

Experts (formation continue)

Industrie pharmaceutique

LA LECTURE CRITIQUE

Mais !

Source primaire

Notoriété pas un gage de qualité et pertinence

Effet de mode

Sources secondaires

Pas à jour

Partial : conflits d’intérêt, interprétation partisane

Effet de mode

DISTORSION DE LA

REALITE ET DU RESULTAT

LA LECTURE CRITIQUE

Conflit d’intérêt

Stelfox HT, NEJM 1998

Inhibiteur Ca2+ : surcroît d’infarctus chez

hypertendus traités (méta-analyse)

Analyse de l’avis de leader d’opinion en fonction de

leurs liens avec l’industrie

Ceux qui contestent : 96% avaient un lien

Avis neutre : 60% avaient un lien

Ceux qui défendent : 37% avaient un lien

LA LECTURE CRITIQUE

Les recommandations pour la pratique

Grilli R, Lancet 2000

Analyse de 431 publications

Critères de qualité : description des personnes impliquées,

description de la méthode pour identifier les études et

description de la gradation (niveau de preuve)

5% avaient tous les critères de qualité

67% ne donnaient pas les personnes impliquées

88% ne décrivaient pas la méthode

82% n’avaient pas de gradation

LA LECTURE CRITIQUE

Intérêts

PatientMédecin

Formation

Initiale

Expérience

personnelle

Préférences

du patient

Essais

cliniques

Sources

secondaires

Contexte social

et de vieContexte

économique

Contexte

législatif

Décision médicale

Analyse critique

Balance Bénéfice – Risque

PatientMédecin

Formation

Initiale

Expérience

personnelle

Préférences

du patient

Essais

cliniques

Sources

secondaires

Contexte social

et de vieContexte

économique

Contexte

législatif

Décision médicale

Analyse critique

Balance Bénéfice – Risque

Intégrer dans la pratique

les résultats des essais

Finalité de l’évaluation de l’efficacité

d’une stratégie de prise en charge

La notion de preuve de l’efficacité

OBJECTIF CLINIQUE

Description

Objectifs de prévention et/ou thérapeutique

Particularité de la prévention : consultant sain qui ne demande rien

Nécessité d’un gain perceptible par le patient

Types

Éviter la survenue d’un événement morbide ou d’un décès

Retarder la survenue d’un événement morbide ou d’un décès

Diminuer la fréquence de survenue d’un événement morbide ou

d’un décès

Augmenter la qualité de vie, etc.

OBJECTIF CLINIQUE

Exemples

Réduire le taux de LDL Cholestérol

Augmenter le périmètre de marche en mètres

Augmenter la couverture vaccinale

Augmenter la fréquence des cancers dépistés

Réduire le risque de survenue d’AVC ischémique

Augmenter la fréquence des patients marchant plus d’1 km

Réduire le risque de cirrhose ou de cancer hépatique

Réduire le risque de décès, quelle que soit la cause

PREUVE DE L’EFFICACITE

Le problème

La médecine : une pratique

Fondement de cette pratique : les données scientifiques

Décision rationnelle (pas basée sur l’intuition, la croyance ou l’ésotérisme)

La recherche fondamentale permet de générer l’hypothèse qu’un

traitement peut apporter un bénéfice

Il faut vérifier cette hypothèse (sinon elle n’est que pure spéculation) par une expérimentation rigoureuse et impartiale

L’hypothèse est alors corroborée ou infirmée

PREUVE DE L’EFFICACITE

Induction - Déduction

Induction Raisonnement physiopathologique

Déduction Test par expérimentation

A

B

C Donc

1 2 A C = ?

PREUVE DE L’EFFICACITE

Essai CAST

Extrasystoles

ventriculaires Mort subite

Anti-arythmique de classe I Infarctus

Démontré

Dém

on

tré non vérifié dans la

confrontation à la

réalité

Surmortalité x 2

Plus de décès que la guerre

du Vietnam

PREUVE DE L’EFFICACITE

Essais CIBIS II, MERIT-HF

Effet inotrope négatif Mortalité

Béta-bloquants Insuffisance cardiaque

Démontré

Dém

on

tré non vérifié dans la

confrontation à la

réalité

Réduction mortalité de 20%

Perte de chance

PREUVE DE L’EFFICACITE

Obtenir des preuves fiables

Ne retenir que les études les plus fiables = risque minime d’être biaisées (faux positif)

Nécessité de répéter l’expérience

ELITE I Réduction significative de 46% du risque de

décès (N=747)

ELITE II Tendance non significative d’augmentation

de 13% du risque de décès (N=1 500)

Pas de sélection arbitraire (tendance à ne retenir que les résultats positifs) !

PREUVE DE L’EFFICACITE

Effet de sélection

Ravnskov et al, BMJ 1992

Hypocholestérolémiants vs Placebo

Nombre de citations

14 essais avec résultats favorables 40 / an

10 essais avec résultats non favorables 7,4 / an

2 essais publiés dans le JAMA

Année post publication 1er 2ème 3éme 4éme

LRC, favorable 109 121 202 180

Miettinen, non favorable 6 5 3

Comment évaluer l’efficacité d’une

stratégie de prise en charge ?

Les grands principes de l’essai randomisé

EXPRESSION DE L’EFFICACITÉ

Critère de jugement clinique

Quel critère de jugement choisir pour exprimer l’effet d’un traitement ?

Objectif d’un traitement : apporter un bénéfice perceptible par le patient

Critère de jugement en terme de bénéfice perceptible par le consultant

Réduire la fréquence des décès

Réduire la fréquence d’une intervention chirurgicale

Amélioration fonctionnelle

CRITÈRE DE JUGEMENT CLINIQUE

APPROCHE OBSERVATIONNELLE

Ce qui est observé est-il différent de ce qui

serait observé sans traitement ?

Quels facteurs peuvent être confondus avec

l’effet du traitement ?

Évolution propre de la maladie

Effets des traitements concomitants

Effets du contexte de soins

Phénomène de régression à la moyenne

etc.

APPROCHE COMPARATIVE

Contrôle historique

Les méthodes diagnostiques diffèrent dans le temps

Les caractéristiques des patients diffèrent dans le temps

Les traitements concomitants et soins diffèrent dans le temps

Contrôle géographique

Les méthodes diagnostiques diffèrent dans l’espace

Les caractéristiques des patients diffèrent dans l’espace

Les traitements concomitants et soins diffèrent dans l’espace

Absence de traitement Effet du traitement peut être confondu avec l’effet placebo

LE COMPARATEUR : PLACEBO

Eff

et

ob

serv

é Effet placebo

Effet nocebo

Information Placebo

Placebo

Actif

Placebo

Placebo

Actif

Actif

Actif Produit réel

Beecher HK et al. Épreuve stressante chez le volontaire sain

Anxiolytique vs Placebo

L’ATTRIBUTION DU TRAITEMENT

Exemples

Le médecin choisit si le

patient aura le traitement ou

le placebo Les patients les plus

graves auront le

traitement Opération chirurgicale ou

surveillance médicale en

fonction de la disponibilité de

la salle

Le patient aura le traitement

si son année de naissance est

un nombre pair

Le patient aura le

traitement si la pièce

tombe sur face

L’ATTRIBUTION DU TRAITEMENT

Problèmes

Quelle est la comparabilité des groupes ainsi constitués ?

La répartition dépend-elle

– du médecin ou du patient ?

– de la maladie, du traitement ?

Conséquences

Effet observé est-il dû au traitement ou à la différence des groupes

constitués au départ ?

Prévisibilité

Mise en évidence d’un effet du traitement qui n’existe pas

L’ATTRIBUTION DU TRAITEMENT

Importance de la randomisation

Essais cliniques randomisés

augmentation de 20 % de la

mortalité cardiovasculaire

Études d'observations

réduction de plus de 25 % de

la mortalité cardiovasculaire

BIAIS DE CONFUSION

Une étude a été menée sur 2 500 sujets tirés au sort dans une

population d’hypertendus et ne recevant auparavant aucun traitement

médicamenteux, pour savoir si un an de traitement par un nouveau

antihypertenseur permettrait de faire diminuer la pression artérielle

systolique (PAS).

A l’entrée dans l’essai, les moyennes de PAS pour les sujets étaient

de 154 ± 5,4 mmHg. Après un an de traitement, la PAS moyenne était

de 123 ± 4,3 mmHg.

La différence entre ces deux chiffres est statistiquement significative,

p<0,0001. Cette étude montre donc l’efficacité de ce nouvel

antihypertenseur pour faire baisser la PAS.

La conclusion proposée est-elle justifiée ? OUI NON

LE MAINTIEN DE LA COMPARABILITÉ

Problèmes

Les groupes qui étaient comparables au début de l’essai le sont-ils encore à la fin du suivi ?

Prise en charge identique

Mêmes traitements concomitants

Critère de jugement attribué de la même façon

Critère de jugement disponible pour tous les patients

Conséquences

Effet observé est-il dû au traitement ou à la différence

de suivi des groupes ?

Sur ou sous-estimation de l’effet du traitement

LE MAINTIEN DE LA COMPARABILITÉ

Les solutions

Évaluation objective du

critère de jugement

Comité d’événements en

aveugle de la thérapeutique

Évaluateur du médecin

prenant en charge le patient

Pas de perdus de vue

Traité Placebo

=

Même forme galénique

Même couleur

Même goût

Même conditionnement

Etc.

Le double aveugle (ou insu)

LE MAINTIEN DE LA COMPARABILITÉ

Le double aveugle

Les patients ne peuvent se distinguer en fonction

de leur appartenance à un groupe ou à un autre

Ni le patient, ni l’investigateur ne connaît la nature

réelle du traitement

Traitements strictement identiques

Placebo

Double placebo (comparaison avec produit de référence)

Randomisation complètement imprévisible

Codage des traitements reçus

PERDUS DE VUE - DONNÉES MANQUANTES

Exemples

T + T - RR

N randomisés 100 100

Evénements 10 20

Perdus de vue 10 30

N analysables 90 70

Risque mesurable % 10 / 90 20 / 70

11% 29% 0,39

Biais maximum % (10+10)/100 20/100

20% 20% 1,00

PERDUS DE VUE - DONNÉES MANQUANTES

Problèmes

Ne pas prendre en compte tous les patients

dans l’analyse finale introduit un biais

Les arrêts du traitement et les sorties

d’essai représentent un échec du

traitement en pratique clinique

Le critère de jugement n’est pas disponible

pour les perdus de vue, ils ne peuvent être

pris en compte dans l’analyse finale même

en intention de traiter

PERDUS DE VUE - DONNÉES MANQUANTES

Solutions

Analyse en intention de traiter

Tous les patients randomisés sont analysés

Dans le groupe où ils ont été randomisés

Pas de perdus de vue

il existe un nb de perdus de vue par critère de jugement

Hypothèse du biais maximum

Tous les patients perdus de vue du groupe traité ont fait

l’événement

Aucun des patients perdus de vue du groupe contrôle ont fait

l’événement

Arrêt du traitement

Suivis jusqu’à la fin de l’étude

CONCLUSION

Les grands principes de l’essai clinique

Prospectif

Comparatif

Contrôlé par un placebo

Randomisé

Suivi en double aveugle

Analyse en intention de traiter sans donnée

manquante

CONCLUSION

Schéma

Randomisation Double aveugle

AIT

Randomisation

Grp T

Grp C

Critère

Critère

Groupes

comparables Maintient de la comparabilité

Biais de sélection Biais de réalisation Biais d'évaluation

Biais d'attrition

Biais de confusion

Contrôle

Les outils statistiques

Indices, p, Test, Intervalle de confiance

LA MESURE DE L’EFFICACITÉ

Nouvel antiagrégant plaquettaire contre placebo

Patients aux antécédents d’AVC ischémique

Prévention II du risque de récidive d’AVC

46 %

54 %

100% 0% 46% 54%

Grp T

Grp C

Effectifs AVC Risques

GRp T 100 4646/100=0,46

(p1)

Grp C 100 5454/100=0,54

(p0)

LE RISQUE RELATIF

%) (en RR1RRR

p0p1RR

LE RAPPORT DES COTES (ODDS RATIO)

Calcul

%) (en RC1RRC

p01p0

p11p1RC

Le risque est de la cote

Risque T- = p0 54 %

Cote T- = p0 / (1 - p0) 1,17 (6 contre 5)

LE RAPPORT DES COTES (ODDS RATIO)

Mauvaise interprétation

1.0

0.0

0.2

0.4

0.6

0.8

0.00 0.25 0.50 0.75 1.00

Risque de base dans le groupe contrôle

Ra

pp

ort

de

s c

ote

s

RR=0.8

Le RC n’est pas le RR

Le RC peut s’interpréter comme un RR mais sous

certaines conditions

!

LA DIFFERENCE DE RISQUE

ATTENTION AU SIGNE !

p0p1DR

INDICES D’EFFICACITE : EXERCICES

Calculer indices

BENEFICE ABSOLU – BENEFICE RELATIF

Bénéfice

relatif

Bénéfice

absolu

Grp T+ Grp T- RR RRR RC RRC DR NNT

46/10046 %

54/10054 %

0,85 15 % 0,73 27 % - 8 % - 13

Récapitulatif des différents indices

Relation entre DR, RR et p0

DR = (1 - RR) x p0 Simulation

LA PRÉCISION DE CETTE MESURE

Problème

On ne connaît jamais la vraie valeur de l’effet d’un

traitement

En réalisant un essai clinique on tente d’approcher

cette vraie valeur en effectuant une mesure de l’effet

du traitement dans une population donnée

Comme toute mesure, celle-ci est plus ou moins

précise

La précision de cette mesure est donnée par

l’intervalle de confiance

Comment interprète-t-on un intervalle de confiance ?

LA PRÉCISION DE CETTE MESURE

Interprétation

Essai A :

RR = 0,77 [0,70 - 0,84]

RRR = 23 % [16 % - 30 %]

L’effet du traitement est

une réduction relative de

23 % du risque de survenue

de l’événement et cette

valeur est compatible avec

une réduction de 30 % au

mieux et de 16 % au pire

Au pire la réduction est de

16 % et est > 10 %, donc

cliniquement pertinente

L ’IC n’englobe pas la valeur 1 : la

différence observée entre les groupes

est donc statistiquement significative

Il y a 95 % de chance que la vraie

valeur de l’effet du traitement soit

comprise entre une réduction de 16 %

et une réduction de 30 %

SIGNIFICATIVITÉ STATISTIQUE

Exemple

Pas d'effet du

traitement

Groupe traité p1 = 10%

Groupe contrôle p0 = 10%

12%

7%

Différence apparente non réelle

Conclusion à tort à l’effet du traitement

Risques observés

Différence observée due

au hasard

La différence observée est-elle due au hasard ?

La différence observée est-elle due à l’effet du traitement ?

SIGNIFICATIVITÉ STATISTIQUE

Problèmes

Comment décider entre les deux

conclusions ?

Conclure avec certitude (à 100 %) à

l’existence ou non d’un effet du

traitement est impossible

SIGNIFICATIVITÉ STATISTIQUE

Solutions

Faire l’hypothèse que l’effet du traitement observé

est dû au hasard

Calculer la probabilité que l ’effet observé soit

compatible avec cette hypothèse

Choisir une probabilité de se tromper (on ne peut pas

conclure avec 100 % de certitude)

Conclure

Principe du test d’hypothèse

SIGNIFICATIVITÉ STATISTIQUE

Le test d’hypothèse

Il est possible de conclure à l’existence de la différence car le risque d’erreur encouru est petit (<5%).

« En faisant cette conclusion, je commets peut-être une erreur, mais je connais parfaitement le risque que j’encoure = 5% »

Différence observée non nulle 7% versus 12%

Calcul de la probabilité p que cette différence soit due uniquement au hasard

P< 5% ?

Il n’est pas possible de conclure car le risque de faire une conclusion erronée est trop important (>5%).

Dans cette situation, le risque d’erreur encouru en concluant à l’existence d’une différence est déraisonnable

oui non

!

SIGNIFICATIVITÉ STATISTIQUE

Le p : mauvaises interprétations

p > 0,05 (5 %)

« L’effet du traitement est similaire entre les groupes »

« Le traitement n’a pas d’effet sur la survenue de l’évt »

p < 0,05 (5 %)

« Le traitement a fait la preuve de son efficacité »

« Le traitement doit être utilisé en pratique clinique car

son effet est pertinent »

SIGNIFICATIVITE STATISTIQUE

Un essai, incluant 4 250 patients, a comparé le fond d’œil par un

ophtalmologue (avec dilatation) à la rétinographie non mydriatique

(nouvelle technique sans dilatation) dans le dépistage des

rétinopathie diabétiques.

La fréquence des cécité a été respectivement de 10,4% et 19,1%,

p=0,56.

L'absence de différence significative permet de conclure que ces

deux tests de dépistage ont une efficacité qui n’est pas différente

(similaire).

La conclusion proposée est-elle justifiée ? OUI NON

Les critères de jugement

LES CRITERES DE JUGEMENT

Typologie

Primaire

Unique pour contrôler le risque de conclure à tort, et pouvoir conclure

Cliniquement pertinent

critère sur lequel porte la démonstration de la preuve de

l’efficacité : analyse confirmatoire

Secondaire

Documente un bénéfice secondaire (effet sur la mortalité, autres

effets sur AVC ou IDM)

Documente le mécanisme d’action (effet sur la mortalité totale, effet

sur la mortalité spécifique)

Critère correspondant à des effets délétères

Clinique, Intermédiaire (TA, taux de LDL Cholestérol, etc.)

Analyse exploratoire

LES CRITERES DE JUGEMENT

Critères cliniques (1)

L’objectif est la guérison de la maladie

Maladie bénigne spontanément résolutive

– Guérison à 100%

– Critère = Durée de la maladie

Maladie grave non résolutive

– Pas de guérison spontanée (appendicite aigue nécessite chirurgie)

– Critère = Taux de guérison

L’objectif est la prévention

Primaire

– Sujets sains mais à risque (hypertendu à risque d’IDM ou d’AVC)

– Critère = Fréquence des événements que l’on cherche à prévenir ou Fréquence

des décès (si la maladie est mortelle)

Secondaire

– Sujets ayant déjà fait un événement et à risque

– Critère = Fréquence des événements que l’on cherche à prévenir ou Fréquence

des décès (si la maladie est mortelle)

LES CRITERES DE JUGEMENT

Critères cliniques (2)

L’objectif est la symptomatologie

Maladie spontanément résolutive ou stade avancé

Exemple : douleur, gène fonctionnelle (dysurie dans adénome bénin

de la prostate)

Critère = Diminuer intensité (score, échelle visuelle analogique) du

symptôme, Faire disparaître le symptôme

L’objectif est la qualité de vie

Maladie incurable

Subjectif

Score

Auto-évaluation ou évaluateur externe

Paradoxe : amélioration de la qualité de vie avec une augmentation de

la mortalité

CRITERE DE JUGEMENT

Un antagonistes direct de l'angiotensine 2 (famille des sartans) a été

comparé à un IEC dans le traitement de patients insuffisants cardiaques.

L'essai est randomisé, en double aveugle, correctement conçu et

réalisé.

L'objectif de cet essai est d'évaluer le retentissement de ce traitement

sur la fonction rénale. La mortalité est aussi enregistrée pour exclure un

éventuel effet délétère de ce traitement. Le critère de jugement principal

est la clairance de la créatinine.

Au terme de l'essai, une réduction statistiquement significative (p<0,001)

de 40% de du risque de décès est observée.

Ce résultat permet de conclure que ce sartan apporte un bénéfice

supplémentaire par rapport aux IECs en terme de réduction de la

mortalité.

La conclusion proposée est-elle justifiée ? OUI NON

LES CRITERES DE JUGEMENT

Critères composites : définition

Critère prenant en compte simultanément

plusieurs événements

Ex : décès ou survenue d’un AVC ou survenue

d’un IDM

Le patient présente le critère composite s’il a fait

l’un des 3 événements

Si un patient fait un AVC puis décède : seul l’AVC

sera compté dans le critère composite

LES CRITERES DE JUGEMENT

Critères composites : exemple

Patients aux antécédents d’IDM

Aspirine (A) vs Placebo (P)

Aspirine N= 1230

Placebo N1228

AVC 13 34

IDM 23 45

Décès 36 80

Critère composite 72 159

Aspirine N= 1230

Placebo N1228

AVC 24 41

IDM 23 45

Décès 54 95

En comptant tous les

événements survenus

dans l’essai

Critère composite =

Somme des événements

LES CRITERES DE JUGEMENT

Critères composites : intérêts

Regrouper des équivalents du même phénomène clinique

Augmenter la puissance pour la mise en évidence d’un effet

Mesurer la balance bénéfice risque

Fibrinolyse dans IDM

Critère = Décès (bénéfice) ou AVC invalidant (risque de la

fibrinolyse)

LES CRITERES DE JUGEMENT

Critères composites : interprétation (1)

T+

N=500

T-

N=500

RR

[IC 95%] p

Décès 20 50 1

[0,54 – 1,84] 1,00

Evénements

non mortels 72 100

0,72

[0,55 – 0,95] 0,02

Critère composite 92 120 0,77

[0,60 – 0,98] 0,03

Peut-on conclure à une réduction

de la morbi-mortalité ?

LES CRITERES DE JUGEMENT

Critères composites : interprétation (2)

T+

N=500

T-

N=500

RR

[IC 95%] p

Décès 57 80 0,71

[0,52 – 0,97] 0,03

Evénements

non mortels 97 100

0,97

[0,76 – 1,25] 0,81

Critère composite 154 180 0,86

[0,72 – 1,03] 0,09

Peut-on conclure à une

réduction de morbi-mortalité ?

LES CRITERES DE JUGEMENT

Critères composites : interprétation (3)

T+

N=500

T-

N=500

RR

[IC 95%] p

Décès 41 50 0,82

[0,55 – 1,22] 0,32

Evénements

non mortels 79 100

0,79

[0,60 – 1,03] 0,08

Critère composite 120 150 0,80

[0,65 – 0,98] 0,03

Peut-on conclure à une réduction

de la morbi-mortalité ?

CRITERE COMPOSITE

Un essai a comparé un stratégie de dosage du LDL Cholestérol à

l’absence de dosage de LDL Cholestérol chez 5 000 patients dans le

cadre du dépistage de patients à risque cardio-vasculaire.

Le critère de jugement principal est un critère composite regroupant le

décès, la survenue d’un infarctus et la survenue d’un AVC.

Cet essai montre que la mise en place d'un dépistage par dosage du

LDL Cholestérol permet de réduire la morbi-mortalité.

La conclusion proposée est-elle justifiée ? OUI NON

Dépistage n=2485

Pas de dépistage n=2515

Décès 4 4

Infarctus 8 7

AVC 40 70

Critère composite 52 (2,1%) 81 (3,2%) p=0,014

Comparaison des caractéristiques

des patients à l’inclusion

COMPARAISON DES CARACTERISTIQUES

Le problème

La randomisation permet à coup sûr de créer des groupes comparable au début de l’essai ?

NON : risque de 5% d’avoir un déséquilibre entre les groupes

Un déséquilibre entre les groupes, sur une variable fortement

corrélée (liée, modifiant) au (le) critère de jugement peut

introduire un BIAIS

La différence observée entre les groupes est-elle due

au traitement étudié ou au déséquilibre entre les

groupes sur cette variable ?

COMPARAISON DES CARACTERISTIQUES

Description

Types de variables pouvant être corrélées au critère de jugement

Facteurs pronostiques

Facteurs de gravité de la maladie (stade, localisation)

Antécédents ou comorbidités

Ancienneté de la maladie

Traitement (autre que celui étudié) en cours à l’inclusion

Contexte de soins (essais dans plusieurs pays)

Mesure

Variable binaire : N et proportion

Variable continue : moyenne ou médiane (écart-type, différence

interquartiles)

COMPARAISON DES CARACTERISTIQUES

Nécessité de tests statistiques ?

La question posée est :

Existe-t-il un déséquilibre entre les groupes sur une

variable fortement corrélée au critère de jugement ?

Ce qui est analysé c’est le risque de biais, pas la

réalité statistique de ce déséquilibre

Le résultat du test indique :

Significatif : sur variable non corrélée = PAS DE BIAIS

Non significatif : même si due au hasard (p>0,05) une

différence entre les groupes sur une variable corrélée = BIAIS

COMPARAISON DES CARACTERISTIQUES

Analyse

L’analyse repose donc sur :

Importance de la variable (intensité de la corrélation avec le

critère de jugement)

Importance (numérique) du déséquilibre entre les groupes

Prévention du déséquilibre

Stratification de la randomisation sur les variables corrélées au

critère de jugement

En cas de déséquilibre

Ajustement : Mantel-Haenszel, analyse multivariée

COMPARAISON DES CARACTERISTIQUES

Exemple

Maladie : cancer du sein

Intervention : dépistage par mammographie vs pas de dépistage

Critère principal : mortalité par cancer du sein

T+ N=1400

T- N=1400

Age : moyenne (écart-type) 55,4 (2,5) 56,5 (2,9)

Antécédents familiaux de KC du sein : n (%) 112 (8,0%) 120 (8,6%)

Puberté < 12 ans : n (%) 173 (12,4%) 167 (11,9%)

Pas d’enfant : n (%) 57 (4,1%) 63 (4,5%)

Premier enfant > 30 ans : n (%) 124 (8,9%) 120 (8,6%)

Pas d’allaitement : n (%) 234 (16,7%) 240 (17,1%)

Ménopause > 50 ans : n (%) 150 (10,7%) 145 (10,4%)

Antécédents d’ulcère gastro-duodénale : n (%) 90 (6,4%) 40 (2,9%)

THS : n (%) 450 (32,1%) 765 (54,6%)

COMPARAISON DES CARACTERISTIQUES

Exemple

Maladie : X

Intervention : Nouveau traitement vs Placebo

Critère principal : Mortalité totale

T+ N=1400

T- N=1400

Age : moyenne (écart-type) 55,4 (2,5) 75,5 (3,1)

Antécédents familiaux de X : n (%) 112 (8,0%) 120 (8,6%)

Antécédents personnels de Y : n (%) 173 (12,4%) 169 (12,1%)

Traitement Y : n (%) 450 (32,1%) 451 (32,1%)

Résultat : Réduction significative de 40% de la mortalité totale

Conclusion : Efficacité du nouveau traitement vs Placebo ?

BIAIS DE SELECTION ET DE SUIVI

Afin d'évaluer l'efficacité d'un traitement antihypertenseur sur la

prévention des maladies coronariennes, un essai randomisé, en ouvert,

contre traitement de référence a inclus 12 598 patients. La

randomisation a été effectuée par enveloppe. La durée de suivi a été de

5 ans. Les caractéristiques de bases des patients sont les suivantes :

A la fin de l'essai, une réduction de 12% de la mortalité coronarienne est

observée dans le groupe du nouveau traitement. Il est ainsi possible de

conclure que ce traitement apporte un bénéfice clinique certain.

La conclusion proposée est-elle justifiée ? OUI NON

Nouveau traitement

n=6298 Traitement conventionnel

n=6300

Age 60 68

Femmes 22% 12%

Pression artérielle systolique 143 150

Pression artérielle diastolique 91 98

Antécédents d'infarctus 23% 28%

Fumeurs 33% 45%

Analyse statistique

ANALYSE EN SOUS-GROUPE

Définition

Subdiviser la population de l’essai en sous population

dans lesquelles étudier l’effet du traitement

Problème : analyses multiples

Nb de tests (k)

Risque alpha global

5

10

20

30

0,23

0,40

0,64

0,78

1 1k

global

Traitement sans effet

5 comparaisons

Risque de 23 % de faire

une conclusion à tort

ANALYSE EN SOUS-GROUPE

Objectifs

Rechercher une différence d’effet dans une sous

population (sexe, âges, etc.)

Analyse de nature exploratoire : ne remet pas en

cause le résultat global de l’essai

Explorer l’extrapolabilité à différentes sous

populations pour documenter l’effet principal

S’assurer de l’absence d’effet délétère dans une

sous population

ANALYSE EN SOUS-GROUPE

Représentation graphique

?

HOPE, NEJM 2000

ANALYSE EN SOUS-GROUPE

Exemple : ISIS 2 (graphique)

Maladie : Phase aigue de l’infarctus du myocarde

Intervention : Aspirine vs Placebo

Critère principal : Mortalité à 30 jours

Sous-groupe : Gémeaux/Capricorne vs Autres signes

ANALYSE EN SOUS-GROUPE

Cas d’un essai non concluant : SU.VI.MAX (1)

Hercberg S, Arch Int Med 2004 – SU.VI.MAX Study

ANALYSE EN SOUS-GROUPE

Cas d’un essai non concluant : SU.VI.MAX (2)

Protocole publié :

1. Pas de critère de jugement principal définit

2. Pas de stratification sur le sexe à l’inclusion

3. Calcul de N ne prévoit pas un effet différent en fonction du sexe

4. Résultat : au moins 9 tests réalisés

Conclusions: After 7.5 years, low-dose antioxidant supplementation lowered

total cancer incidence and all cause mortality in men but not in women.

Supplementation may be effective in men only because of their lower

baseline status of certain antioxidants, especially of beta-carotene.

LA CONCLUSION DEPASSE LES DONNEES

ANALYSE EXPLORATOIRE !

ANALYSE EN SOUS-GROUPE

Cas d’un essai concluant

ANALYSE EXPLORATOIRE

Nouvelle hypothèse à tester

dans un nouvel essai

Mauvaise interprétation =

conclusion à tort à l’absence

d’effet (comme le tt est

efficace = perte de chance)

ANALYSE EN SOUS-GROUPE

Planification d’une analyse en sous-groupe

Nb restreint de sous-groupes

Sous-groupes définis a priori dans le protocole

Randomisation stratifiée sur sous-groupe

Calcul de N pour mettre en évidence effet dans chaque strate

Seuil corrigé pour analyses multiples (/k, k=nombre d’analyses ou sous-groupes)

Niveau de preuve d’analyse en sous-groupe < niveau de preuve du résultat global

Générer une nouvelle hypothèse = nouvel essai

SOUS-GROUPE

Un essai a évalué l'effet d'un nouveau traitement hypoglycémiant sur

la fréquence des complications cardiovasculaires dans le DNID par

une comparaison au placebo.

Aucune différence significative n'a été observée entre les deux

groupes au terme du suivi de 4 ans.

Cependant, une diminution significative de la fréquence de ces

complication est obtenue dans le sous groupes des diabétiques

hypertendus.

Le résultat permet de conclure à la démonstration de l'intérêt de ce

traitement chez les patients diabétiques et hypertendus et doit donc

conduire à sa recommandations.

La conclusion proposée est-elle justifiée ? OUI NON

ANALYSE EN INTENTION DE TRAITER

Le problème : les écarts au protocole

Arrêt de prise du traitement (nouveau ou placebo)

Absence de prise du traitement (nouveau ou placebo)

Mauvaise observance

Prise du traitement de l’autre groupe (cross-over)

Prise de traitement interdit

Inclusion de patients n’ayant pas les critères d’inclusion

Perdus de vue (non présentation à la visite de suivi, critère

non mesuré, etc.) = données manquantes

ANALYSE EN INTENTION DE TRAITER

Conséquences

Perte de patient est liée au traitement ou à

l’évolution de la maladie

Sortie des mauvaises tolérances au traitement

Sortie des patients les plus graves

Perte (attrition) de patient = BIAIS

Continuer à suivre les patients sortis

Enregistrer les événements

Les inclure dans les analyses

ANALYSE EN INTENTION DE TRAITER

Définition

Tout patient randomisé est analysé et dans

le groupe dans lequel il a été randomisé

Permet de prendre en compte les facteurs

susceptibles de faire échouer le traitement

Essai pragmatique Essai explicatif

ANALYSE EN INTENTION DE TRAITER

L’exemple du Centoxin (1)

Maladie : Septicémie à Gram –

Traitement : Centoxin vs Placebo

Critère principal : Mortalité à 28 jours

Pour être efficace le Centoxin doit être donné

très précocement, bien avant la confirmation

bactériologique par les hémocultures

Centoxin Placebo

N Randomisés car suspicion de

septicémie à Gram – 262 281 543

N Exclus car pas de confirmation

bactériologique 157 189

346

(63,7%)

N Analysés 105 92 197

Décès parmi les analysés 32

(31%)

45

(49%)

RR=0,62

p=0,014

Décès parmi tous les patients 102

(39%)

121

(43%)

RR=0,91

p=0,24

Ziegler EJ, NEJM 1991

Résultat fut

accepté

Coût : 3 500 €

ANALYSE EN INTENTION DE TRAITER

L’exemple du Centoxin (2)

La sélection a entraîné un déséquilibre des groupes

Centoxin Placebo

CIVD 18 % 21 %

Détresse respiratoire de l’adulte 9 % 13 %

Défaillance hépatique aigue 19 % 26 %

Insuffisance rénale aigue 35 % 46 %

En pratique la vraie question est :

chez des patients avec suspicion

de septicémie à Gram –, le

Centoxin apporte-t-il un bénéfice ?

Effet non confirmé par essai CHESS (n=2 199)

McCloskey RV, Ann Intern Med 1994

BIAIS D’ATTRITION

L'efficacité d'un traitement hypertenseur a été évalué dans un essai

randomisé contre placebo réalisé en double insu.

1250 ont été randomisés dans le groupe traité et 1254 dans le groupe

contrôle. En moyenne, les patients ont été suivi 5,1 ans. Au terme de

l'essai, 15% des patients avaient arrêté de prendre le traitement de

l'étude. Étant donné que ces patients ne pouvaient bénéficier de l'effet du

traitement, il n'ont pas été pris en considération dans l'analyse. Ainsi 159

décès / 1062 patients ont été observés dans le groupe traité et 213 / 1254

dans le groupe contrôle conduisant à un risque relatif de 0.88 (p<0.05).

Ce résultat démontre que ce traitement permet de réduire la mortalité des

patients hypertendus.

La conclusion proposée est-elle justifiée ? OUI NON

La pertinence clinique

PERTINENCE CLINIQUE

Objectif de l’essai (1)

Pour être définit, l’objectif doit préciser :

Le traitement testé

Le comparateur (placebo ou traitement actif)

Le critère de jugement principal (et le moment de sa mesure)

Les patients concernés (maladie et caractéristiques particulières)

Composantes de l’estimation de la pertinence clinique

Estimation de la taille de l’effet doit être précise : éliminer un effet sans

intérêt en pratique clinique

Comparateur adapté : placebo ou traitement de référence validé

Patients inclus doivent être représentatifs des patients vus en pratique

clinique

PERTINENCE CLINIQUE

Objectif de l’essai (2)

Pertinence de la question thérapeutique ou

préventive

Pertinence du critère de jugement principal

Pertinence du traitement testé et de sa durée

Pertinence du comparateur

PERTINENCE CLINIQUE

Comparateur adapté

Si comparateur est un placebo : il n’existe pas de

traitement de référence ayant démontré son efficacité

Si comparateur est un traitement de référence :

efficacité établie aux doses et schéma utilisés dans

l’essai

Le nouveau traitement est étudié en présence des

traitements concomitants utilisés en pratique clinique

dans la pathologie considérée

PERTINENCE CLINIQUE

Praticabilité du traitement

La mise en œuvre du traitement est réalisable

en pratique clinique

Schéma thérapeutique

Surveillance, etc.

Traitement est arrêté en cas de mauvais

tolérance de façon similaire à ce qui se passe

en pratique

Pas d’arrêt non justifié

PERTINENCE CLINIQUE

Critère de jugement

Critère clinique

Correspond à un objectif pertinent pour le

patient

Si critère composite, chaque composante

à la même pertinence

Le moment de mesure est pertinent

PERTINENCE CLINIQUE

Représentativité des patients inclus

Le risque de survenue d’événement dans le groupe

contrôle est proche de celui rencontré chez ses

patients

Les critères de sélection font appels à des

techniques et des méthodes disponibles en routine

Pas de limite d’âge supérieure si non justifiée

Définition opérationnelle de la maladie

correspondant à ce que l’on rencontre en pratique

PERTINENCE CLINIQUE

Dans la pathologie considérée il est admis qu'un traitement

entraînant une réduction relative du risque inférieure à 10% ne

présente pas d'intérêt en pratique.

Dans un essai évaluant un nouveau traitement, la réduction relative

du risque est de 6% avec un intervalle de confiance à 95% de

[10%;1%].

Ce résultat permet de conclure que ce traitement apporte un

bénéfice cliniquement pertinent ?

La conclusion proposée est-elle justifiée ? OUI NON