Méthodologie des essais de phase III Bases de l’organisation de la recherche biomédicale
description
Transcript of Méthodologie des essais de phase III Bases de l’organisation de la recherche biomédicale
Méthodologie des essais de phase III Bases de l’organisation
de la recherche biomédicale
Professeur Patrick Rossignol
Centre d ’Investigation Clinique
& consultation multidisciplinaire d’HTA
du CHU de Nancy
& INSERM 961
Les essais cliniques
Doivent répondre à 2 questions majeures:
• Le traitement apporte t-il un bénéfice établi avec fiabilité ?– Résultat fiable: résultat réel et non biaisé
• Le bénéfice est-il cliniquement pertinent de façon à pouvoir l’utiliser en pratique ?
Essais cliniques : grands principesEssai clinique = outil de mesure de l’efficacité
• Mesure =
• La méthodologie vise à éliminer l’effet des facteurs confondants
vraie valeur + erreur de mesure (aléatoire) +facteurs confondants connus ou inconnus
ESSAI CONTRÔLE et RANDOMISE (ECR)
ECR : DEFINITION
• Étude ds laquelle les chercheurs répartissent par tirage au sort (= randomisation) des sujets répondant à des critères d’inclusion précis dans des groupes qui feront ou non l’objet d’une ou plusieurs interventions.
• Les résultats seront ensuite analysés en comparant les résultats dans chacun des groupes
• C’est une étude scientifique expérimentale (la manœuvre testée est imposée au patient et au médecin, et non choisie par eux), prospective (les sujets sont exposés à la manœuvre testée, puis suivis jusqu’à apparition du critère de jugement)
• L’ECR permet seul d’établir un lien de causalité entre une intervention et un état donné parce qu’il permet de conclure que le résultat observé est dû à l’intervention, et seulement à l’intervention
ECR : CARACTERISTIQUES
CONTRÔLE : un point de sémantique !
Le terme « contrôle » ( ou témoin) fait référence à 2 notions différentes :
• Le groupe contrôle = groupe de comparaison (produit de référence ayant l’AMM ou placébo , ou de manière plus gle option thérapeutique testée vs. absence de tt)
• Le contrôle APRES RANDOMISATION : le contrôle, comme celui de la randomisation, permet de diminuer les biais qui peuvent survenir après la randomisation.
Ainsi : la randomisation assure que les groupes sont comparables au départ, les méthodes de contrôle permettent qu’ils le restent
• Moyen : quasi systématiquement, qd c’est possible double aveugle, afin d’éviter que la connaissance du produit influence le comportement du médecin ou celui du patient, donc le résultat de l’essai
Biais et erreurs• Biais
– Erreur systématique produisant une estimation de l’effet du traitement (pourcentage, risque relatif…) qui diffère systématiquement de la vraie valeur
• Erreur aléatoire– Liée à fluctuations d’échantillonnage et affecte la
précision de l’estimation– Prise en compte dans l’expression des résultats
(intervalle de confiance) et le jugement de signification (p)
– Moins grave que le biais car on peut diminuer les erreurs aléatoires en augmentant la taille de l’échantillon
Erreurs et biais
précis et non biaisé peu précis et non biaisé
Précis et biaisé peu précis et biaisé
CONTRÔLE : un point de sémantique !
Le terme « contrôle » ( ou témoin) fait référence à 2 notions différentes :
• Le groupe contrôle = groupe de comparaison (produit de référence ayant l’AMM ou placébo , ou de manière plus gle option thérapeutique testée vs. absence de tt)
• Le contrôle APRES RANDOMISATION : le contrôle, comme celui de la randomisation, permet de diminuer les biais qui peuvent survenir après la randomisation.
Ainsi : la randomisation assure que les groupes sont comparables au départ, les méthodes de contrôle permettent qu’ils le restent
• Moyen : quasi systématiquement, qd c’est possible double aveugle, afin d’éviter que la connaissance du produit influence le comportement du médecin ou celui du patient, donc le résultat de l’essai
Solution = Étude comparative
• Comparaison à un groupe contrôle – le groupe contrôle donne une référence– l'effet du traitement est déterminé par
comparaison avec cette référence
Essai en groupes parallèles (1)
groupe 1
groupe 2
groupe 1
groupe 2
groupe 3
Essai en groupes parallèles (2)
groupe 1
groupe 2
groupe 3
placebo
évaluation des patients
Essai croisé (1)
BaseLine A B
B A
Allocation aléatoire : définition
• = « randomisation »
• Procédé, dépendant du hasard seul, qui permet de répartir les patients dans les groupes de traitement : constituer des groupes « identiques »
• Il consiste à attribuer à chaque patient, selon une liste pré-établie, une nature de traitement, ou une séquence (plans croisés)
• Toujours possible dès qu’il y a groupes contemporains
Randomisation
Chaque patient a la même chance de recevoir le nouveau traitement ou le traitement standard
Ne peut être deviné à l’avance
Caractéristiques basales des patients similaires dans le groupe TTT et le groupe contrôle
Permet d’assurer (si double insu) une prise en charge similaire dans les deux groupes
Evite les biais
Importance de la randomisation
• Neuro-stimulation transcutanée (Carroll, 1996)
• Études non randomisées : 17 études positives sur 19 (89%)
• Essais randomisés 2 positifs parmi 17 (12%)
2
1517
2
0
5
10
15
20
Essaisrandomisés
Etudes nonrandomisées
Résultat positif Résultat négatif
• Evolution spontanée
• Régression à la moyenne
• Effet placebo
• Facteurs d’environnement
• Traitements concomitants
• Facteurs inconnus
• Effets du traitement testéDEUX CONDITIONS
ATTRIBUTION ALEATOIREDOUBLE INSU
L’essai contrôlé avec attribution aléatoire
– guérison (ou aggravation spontanée)– facteur de confusion : l'évolution naturelle est
confondue avec l'effet du traitement
Évolution naturelle
Évolution naturelle
t
température
37°C
39°C
Évolution observée
Évolution spontanée
Attribué au médicament
• Evolution spontanée
• Régression à la moyenne
• Effet placebo
• Facteurs d’environnement
• Traitements concomitants
• Facteurs inconnus
• Effets du traitement testéDEUX CONDITIONS
ATTRIBUTION ALEATOIRE
DOUBLE INSU
L’essai contrôlé avec attribution aléatoire
Régression à la moyenne -1• Mesure variable
– expression artérielle
• Conséquence– A un moment donné, un sujet peut avoir une
valeur particulièrement élevée par rapport à sa vraie valeur
Régression à la moyenne - 2• Sélection des patients en fonction d'un seuil
• Conséquence– La moyenne d'un groupe sélectionné d'après un seuil diminue dans le temps en dehors de toute baisse des vraies valeurs des sujets
Sélection Mesures ultérieures
Seuil
• Evolution spontanée
• Régression à la moyenne
• Effet placebo
• Facteurs d’environnement
• Traitements concomitants
• Facteurs inconnus
• Effets du traitement testéDEUX CONDITIONS
ATTRIBUTION ALEATOIREDOUBLE INSU
L’essai contrôlé avec attribution aléatoire
Effet placebo
• Effet bénéfique du traitement apporté en dehors de tout effet biologique
• Effet placebo en thérapeutique– élément positif et utile
• Effet placebo en expérimentation– élément parasite dont on cherche à se
débarrasser
Effet placebo - visualisation
Information donnée au sujet Placebo Actif Actif
Placebo Placebo ActifNature
Effet placebo
Effet propre a médicament
Niveau de base
Effet placebo• Effet secondaire du placebo
(Beecher HK et al.)– somnolence 50%– Céphalées 25%– Condition physique 18%– Difficultés intellectuelles 15%– Endormissement 10%
• Effet secondaire sévères– Malaise vagal– Signes cutanés
Effet placebo - conséquence
• Le groupe contrôle doit recevoir un traitement pour contrôler l'effet placebo
• Utilisation d'un placebo– même apparence– même posologie– indiscernable du traitement actif
• Le placebo aide aussi au maintien de l'aveugle
Essai randomisé en double aveugle (n=42 418 patients)
ALLHAT officers. JAMA 2002; 288: 2981
Chlorthalidone ( n=15 255)
amlodipine (n= 9 048)
lisinopril (n=9 054)
doxazosine (n=9 067)
Pravastatine(n=5 170)
Traitement usuel(n=5 185)
Morbi-m
ortalité coronaire
Comparaison ouverte
Dou
ble
insu
55 ans et plus, HTA systolique ou diastolique,un facteur de risque coronaire supplémentaire
ALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack Trial
OBJECTIF DE L’ESSAI : très précisément défini
Déterminer si la survenue d’une maladie coronaire fatale ou d’un infarctus du myocarde non fatal est moindre chez des patients hypertendus à haut risque traités par un antagoniste calcique (amlodipine) ou un inhibiteur de l’enzyme de conversion de l’angiotensine (lisinopril) ou un alpha-bloquant (doxasosine), par comparaison à un diurétique (chlorthalidone).
ALLHAT, JAMA 2002
Csq de l’objectif :choix du TYPE d’ESSAI
• Essai d’efficacité : vise à démontrer la supériorité d’une intervention par comparaison à l’intervention de référence ou à l’absence d’intervention
Csq de l’objectif :choix du TYPE d’ESSAI
• Essai d’efficacité : vise à démontrer la supériorité d’une intervention par comparaison à l’intervention de référence ou à l’absence d’intervention
• Essai d’équivalence ou de non-infériorité : vise à démontrer qu’une intervention a une efficacité au moins égale à la référence, en apportant éventuellement des gains au plan individuel (effets secondaires, tolérance, qualité de vie) ou collectif (coût)
CRITERES DE JUGEMENT
Critère principal d’évaluation, sur lequel porte la conclusion essentielle de l’essai
Il doit être unique, cliniquement pertinent et consensuel
CRITERES DE JUGEMENT
• Critère principal d’évaluation, sur lequel porte la conclusion essentielle de l’essai
Il doit être unique, cliniquement pertinent et consensuel
• Critères secondaires : précisent le résultat obtenu (effets secondaires par ex)
DEFINITION DU CRITERE DE JUGEMENT
-critère clinique (ex : mortalité, accident vasculaire...)
-critère intermédiaire (ex : glycémie, cholestérolémie...)
- critère de substitution (ex : vigilance / tps de réaction au bruit...)
- critère combiné (ex : mortalité vasculaire + IDM + AVC)
Critère mesuré de la même façon dans les deux groupes
Préférer les critères objectifs si possible
CRITERES DE JUGEMENT : BIEN CHOISIR !
• Surtout pour le critère principal, ils doivent avoir de bonnes qualités métrologiques : aisément mesurable, peu coûteux, reproductible….
• Si choix d’un score ou d’une échelle : doivent être validé ; définition précise des maladies…
combinaison de maladie coronaire fatale ou d’un infarctus du myocarde non fatal
Critère de jugement primaire
ALLHAT
• mortalité de toute cause, • accident vasculaire cérébral fatal ou non,• maladie coronaire combinée (combinaison du critère primaire, de revascularisation coronaire,
d’hospitalisation pour angine de poitrine)
• maladies cardiovasculaires combinées(maladie coronaire combinée, accident vasculaire cérébral, autres
angines de poitrine traitées, insuffisance cardiaque (fatale, hospitalisée, ou traitée mais non hospitalisée), artériopathie périphérique)
4 critères de jugement secondaires
prespecifiés ALLHAT
CRITERES D’INCLUSION ET DE NON INCLUSION
C’est l’ensemble des caractéristiques qui permettront de décrire la population à laquelle s’appliqueront les résultats de l’essai
CRITERES D’INCLUSION ET DE NON INCLUSION
« C’est l’ensemble des caractéristiques qui permettront de décrire la population à laquelle s’appliqueront les résultats de l’essai »….si on choisit des critères trop stricts, on limite l’applicabilité de l’essai en population générale (validité externe : niveau d’applicabilité d’un essai)
CRITERES D’INCLUSION EXEMPLE (ALLHAT)
Patients non traités : PA>140/90 mm HgPatients traités par 1 ou 2 antihypertenseurs: PA ≤160/100 mm Hg
ETAge ≥ 55 ans
ETAU MOINS UN FACTEUR DE RISQUE CARDIOVASCULAIRE parmi :
Antécédent > 6 mois infarctus du myocarde ou attaque cérébraleHypertrophie ventriculaire gauche
Diabète de type 2Tabagisme actif
HDL cholestérol <0.91 mmol/LAntécédent d’autres maladies cardiovasculaires
CRITERES DE NON INCLUSIONEXEMPLE (ALLHAT)
Insuffisance cardiaque traitée ou ayantnécessité une hospitalisation
DETERMINATION DE L’EFFECTIF ANALYSE STATISTIQUE
Problématique des comparaisons
• la différence observée est-elle ?
– une manifestation des fluctuations aléatoires, donc due uniquement au hasard
– la traduction d’une réelle différence entre les deux groupes, donc d’un effet non nul du traitement
En pratique• Comment conclure ?
– toute conclusion est potentiellement erronée
• Test statistique– moyen de contrôler le risque d'erreur que l'on
prend en faisant une conclusion (maîtrise du risque alpha)
– permet de prendre une décision en connaissance de cause
Risques d'erreur statistiques
• Risque alpha : risque de conclure à une différence qui n’existe pas
• Risque béta : risque de ne pas mettre en évidence une différence qui existe réellement
• Puissance : 1 - béta : probabilité de mettre en évidence une différence qui existe réellement
Application à l’essai thérapeutique
• Risque alpha : considérer comme efficace un traitement qui ne l’est pas
• Risque bêta : ne pas conclure alors que le traitement est efficace
• Puissance : montrer l’efficacité d’un traitement réellement efficace
Test statistique
• Calcul de la probabilité p
• p : probabilité que la différence observée soit due uniquement au hasard
• p représente le risque de faire une conclusion erronée si l'on décidait de conclure
• On ne conclut que si ce risque d'erreur est suffisamment petit
Test statistique
• Seuil de risque de conclusion erronée acceptable– seuil de risque alpha = 5%
• p < 5%– on prend le risque de conclure
• p > 5%– on ne conclut pas
Différence non significative
Résultatnon significatif
Résultatnon significatif
Absence réelle d'effet
Absence réelle d'effet
Manque de puissance
Manque de puissance
?
• Impossible de conclure• Ne pas conclure à l’absence de différence• «L’absence de preuve n’est pas la preuve de
l’absence»
Attention message !Ne pas pêcher de poisson dans une rivière
ne signifie pas qu’il n’y en a pas
par analogie
Ne pas conclure d’un test non significatif qu’il n’y a pas de différence entre les groupes !...
Intervalle de confiance• Différence = -6%• IC 95% = [-8%,-4%]
• Il y a 95% de chance que la vraie valeur de la différence soit entre -8% et 4%
• reflète l'incertitude de l'estimation – Intervalle de confiance a une prob de 95% d'inclure la vraie
valeur
-6
-8 -4
Dualité intervalle de confiance - test statistique
• Différence non significative
-7.5% -5.0% -2.5% 0.0% 2.5%
-7.5% -5.0% -2.5% 0.0% 2.5%
Dualité intervalle de confiance - test statistique
• Différence significative
NOMBRE DE SUJETSPour diminuer le nombre de sujets nécessaires
• augmenter la fréquence du critère de jugement- critère composé- critére intermédiaire- sujets à risque- allongement de la période de surveillance
• augmenter la différence espérée
• diminuer la variabilité de la mesure
• diminuer la puissance
DETERMINATION DE L’EFFECTIF ANALYSE STATISTIQUE
Exemple ALLHAT
Puissance 83 % de détecter une diminution de 16 % du risque de critère primaire sous chlorthalidone avec un risque alpha 0.017 (= 0.05/3 pour ajuster sur 3 comparaisons : inhibiteur calcique, inhibiteur de l’enzyme de conversion, alpha bloquant)
ANALYSE STATISTIQUEMETHODOLOGIE
EXEMPLE
soit un essai où 100 patients ont été attribués par randomisation au groupe A et 100 au groupe B .
Au cours de l’essai, 10 abandonnent leur traitement dans le groupe A, tandis que dans le groupe B, 5 abandonnent le traitement et 5 reçoivent en fait A.
Comment analyser ces données ?
Analyses en Intention de Traiter à privilégier
Dans les essais “pragmatiques” comparant des strategies
analyser Tous les patients randomisés dans leurs groupes d’allocation indépendamment du traitement qu’ils ont en fait reçus (100 A et 100 B)
Permet une comparaison non biaisée des stratégies
•Analyses en Intention de Traiter à privilégier +++
•Analyse per-protocole : compare les groupes effectivement traités dans les termes du protocole (90 A et 90 B). Mais la comparabilité originelle n’est pas garantie (2 fois plus de patients abandonnent A que B) : cette analyse comporte donc un grand type de biais
•Analyses en Intention de Traiter à privilégier +++
•Analyse per-protocole : compare les groupes effectivement traités dans les termes du protocole (90 A et 90 B). Mais la comparabilité originelle n’est pas garantie (2 fois plus de patients abandonnent A que B) : cette analyse comporte donc un grand type de biais
•Exemple : ALLHAT Les données ont été analysées selon le groupe alloué par randomisation, indépendamment des traitements suivis en cours d’étude ‘intention de traiter”
Résultat sur le critère principal : absence de différence significative
0,20 -
0,16 -
0,12 -
0,08 -
0,04 -
0 -1 2 3 4 5 6 70
chlorthalidone
amlodipine
lisinopril
Années jusqu’à l’événement coronaire
Ta
ux c
um
ulé
d’é
vén
em
en
ts c
oro
nair
es
ALLHAT officers. JAMA 2002; 288: 2981
Taux cumulé d’événements pour le critère principal(décès coronaire ou IDM non fatal)
ALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack Trial
Taux de survenue d’événements validants (% par an)
ALLHAT officers. JAMA 2002; 288: 2981
IDM ou mort coronaire
Mortalité toutes causes
Tout événement coronaire
AVC
Tout événement CV
1,91
2,88
3,32
0,93
5,15
1,90
2,87
3,47
1,05
5,55
1,88
2,80
3,32
0,90
5,33
p=0,02
p<0,001
Groupe de randomisation chlorthalidone lisinopril amlodipine
ALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack Trial
Evolution de la PAS et de la PAD (valeurs moyennes / années de suivi)
ALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack TrialALLHAT : Antihypertensive and Lipid Lowering treatment to prevent Heart Attack Trial
ALLHAT officers. JAMA 2002; 288: 2981
PAS moyenne
150 -
145 -
145 -
135 -
130 -0 1 2 3 4 5 6
90 -
85 -
80 -
75 -
70 -0 1 2 3 4 5 6
mmHg
mmHg
chlorthalidone
amlodipine
lisinopril
PAD moyenne
Années de suivi Années de suivi
QUANTITES D’EFFET (1)IDM Pas d’IDM Total
Médicament M
100 900 1000
Placebo P 200 800 1000
QUANTITES D’EFFET (2)IDM Pas d’IDM Total
Médicament M
100 900 1000
Placebo P 200 800 1000
Incidence des IDM sous placebo : Ip = 20 %Incidence des IDM sous médicament : Im = 10 %
Risque relatif = RR = Im/Ip = 0.1/0.2 = 0.5
RRR : réduction relative du risque = 1-RR exprimé en % = 1-0.5 = 50 %
RAR : réduction absolue du risque : Im-Ip = 0.1-0.2 = -0.1. Le traitement évite 10 % d’IDM
NST : nombre de sujets à traiter : : nombre de patients à traiter pour prévenirEn moyenne UN résultat défavorable (ici, 1 IDM) = 1/RAR = 1/0.1 = 10
En résumé:Essai clinique contrôlé
La différence entre les groupes est due au traitement
effet des facteurs confondants connus
ou inconnus+
effet du traitement
Groupe traité Groupe contrôle(témoin)
Allocation aléatoire
Double insu
Analyse en intention de traiter
CPP Avis favorable
PromoteurN° Eudract DébutTaxe de l’essaiDossiers
ANSM Autorisation
Base de données Européenne
Délais fixés – procédure parallèle possible
Démarrage d’un essai clinique
ANSM1 + CPP 2
ARS 6
6 Agence Régionale de Santé
1. Agence Nationale de Sécurité du Médicament et des produits de santé
ANSM