L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B)...

20
20/03/2020 à 13h30 Ronéotypeurs : Acher Ines et Achille Maryline Ronéoficheurs : Acher Ines et Achille Maryline Cours 4 : Survie et Pronostic - Ce cours a été donné en partant du principe que nous avions appris le premier document du cours 4 donné sur moodle et intitulé “L3 Ronéo 9 UE11 cours 4 1

Transcript of L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B)...

Page 1: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

20/03/2020 à 13h30

Ronéotypeurs : Acher Ines et Achille Maryline

Ronéoficheurs : Acher Ines et Achille Maryline

Cours 4 :

Survie et Pronostic

- Ce cours a été donné en partant du principe que nous avions appris le premier document du cours 4 donné sur moodle et intitulé “L3 Pronostic 2020”. Un petit résumé a été fait en première page de ronéo. Nous avons conservé le plan de la ronéo de l'année dernière. A savoir qu’en ce temps de confinement, nous n’avons pu avoir les explications du professeur, et n’avions comme seul outil de travail les diapositives postées le jour-même.

I1) Résumé du support de cours présent sur Moodle

Ronéo 9 UE11 cours 4 1

Page 2: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

● A) Définitions diagnostic/ prognostic

● B) Définitions Facteur pronostique/ facteur de risque

● C) Les courbes de survie

I) Définitions A) Les données de survie

II) Analyse de données

A) Les Données censurées

B) Estimation de la fonction de survie de Kaplan Meier

III) Modèles de comparaison et de régression

IV) Risque relatif et Hazard Ratio

I1. Résumé du support de cours présent sur moodle

A) Définitions diagnostic/ prognostic

Ronéo 9 UE11 cours 4 2

Page 3: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

Le pronostic d’un malade, est la prédiction de son devenir. C’est une supposition de ce qui doit arriver. En médecine c’est une prédiction de l’évolution d’une maladie.

Le diagnostic est la détection d’un symptôme ou d’une maladie. Il définit la reconnaissance.

En médecine, le médecin cherche l’évolution possible de la pathologie qu’il étudie. Pour ce faire, il utilise des informations pronostiques, qui sont des facteurs associés au devenir du patient, tout comme les facteurs diagnostics sont des facteurs associés à un diagnostic donné.

➢ En situation diagnostique, le médecin doit choisir entre deux alternatives :- Le sujet est malade- Le sujet est non malade

Cette décision est sujette à des risques d’erreur par défaut de sensibilité (lorsque que le test est faussement négatif) ou de spécificité (lorsque le test est faussement positif).

➢ En situation pronostique, il est confronté à des erreurs de décision.

B) Définitions Facteur pronostique/ facteur de risque

● Une facteur pronostic est associé au devenir de la maladie, tandis que les facteurs de risque sont associés à la survenue de la maladie. Les facteurs pronostiques s’appliquent donc à des patients malades dans un champ de recherche clinique, alors que les facteurs de risques s’appliquent à des sujets sains dans un champ épidémiologique, cette fois. Selon le cas, un critère peut être à la fois un facteur pronostique et un facteur de risque. Par exemple,l’âge est un facteur de risque de la population saine ET un facteur de mauvais pronostic dans l’infarctus du myocarde.

C) Les courbes de survie

Ces courbes permettent la description des délais de survie, en utilisant la fonction de survie. On peut estimer la fonction de survie à partir d’un échantillon de malade suivi au cours du temps, dans le cadre d’une étude de cohorte par une approche non paramétrique, mais qui prend en compte la censure des observations. L’estimation de la distribution de ces délais de survie repose sur la méthode de Kaplan Meier.

I. Définitions

Il existe une distinction entre le diagnostic et le pronostic.

Ronéo 9 UE11 cours 4 3

Page 4: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

● - Diagnostic : identification de la maladie avec des signes « diagnostics »

● - Pronostic : prévision de l’évolution de la maladie et de son degré de gravité. Le pronostic est la prédiction du devenir du patient, que l’on peut également évaluer grâce à la survie.

A) Les données de survie :

● La survie des malades sous-entend une définition en « tout ou rien ». En effet parler de survie, c’est parler de mortalité. Elle peut être discutée dès la sortie de l’hôpital, à J14, J28, J90, à des instants plus ou moins précoces… Une part est attribuable à la prise en charge des pathologies aiguës ou chroniques sous-jacentes.

« Données de survie » : ce terme devenu générique, s’applique à tout événement binaire caractérisant un passage d’un état à un autre. Il concerne donc :

- Tout délai d’événement « en tout ou rien »

- Tout délai de transition entre 2 états

● À l’instant initial, tous sont dans l’état 0, et l’on s’intéresse aux transitions vers l’état 1.● On peut prendre pour exemple les durées de séjour USI/hôpital.

Les Buts d’une analyse de survie sont les suivants :

• Estimer des fonctions de survie (ou de risque) à partir d’échantillons et les interpréter

• Comparer ces fonctions pour deux ou plusieurs groupes

• Étudier l’influence d’autres variables sur la survie des patients (régression)

Ronéo 9 UE11 cours 4 4

Page 5: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

Prenons un exemple : ALLO-ICU

● faisons l’étude d’une Cohorte de malades d’hématologie admis en réanimation● N= 497 malades admis de 1997 à 2011 dans 3 USI

Ces pourcentages s’interprètent comme :

● Des mesures de prévalence● Quantifient le problème dans une population (homogène)

Une telle analyse de « survie » ignore l’instant de survenue des événements et suppose un temps de suivi identique pour tous.

Si on a mesuré les dates de décès, on peut calculer un « délai de survie », T, supérieur ou égal à 0, qui est un délai de survenue d’un événement (tel que le décès) à partir d’une même date pour tous.

C’est donc un délai de transition entre 2 états :

Il existe alors une nécessité de disposer d’un suivi, en notant recueillant les différentes dates de chaque de début de suivi et de survenu d’évènement.

➢ Loi de probabilité de T(1)

Si T est une variable aléatoire discrète, la loi de

T est donnée par :

Ronéo 9 UE11 cours 4 5

Page 6: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

Si T est une variable aléatoire continue, la densité de probabilité est définie par :

➢ La loi de probabilité de T(2)

C’est une fonction de répartition. F(t) représente la fraction d’individus ayant présenté l’événement avant ou en t.

➢ La loi de probabilité de T(3)

C’est une Fonction de survie : S(t) =1-F(t)= P(T > t)

En pratique, l’estimation se fait en temps discret :

Ronéo 9 UE11 cours 4 6

Page 7: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

➢ La loi de probabilité T(4)

C’est une fonction de risque instantané, on parle de densité conditionnelle.

Pour illustrer, prenons ces différents exemples :

II. Analyse des données

A) La donnée censurée

L’analyse de ces délais reste particulière pour deux raisons :

La distribution est très asymétrique et prend une allure exponentielle, preuve en image :

- Une deuxième raison reste la donnée censurée. Quand la durée d’observation ne permet pas d’observer tous les événements.Ceux-ci peuvent intervenir avant la période de surveillance, ou après. C’est la non survenue de l’événement en fin d’observation avec T > tc. On dit que le délai

Ronéo 9 UE11 cours 4 7

Page 8: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

(vrai) de survie est censuré à droite quand l'événement survient après la période étudiée.

Il existe différents mécanismes à l’origine de cette non observation :

● le sujet n’a pas présenté l’événement à la fin de l’étude car le suivi s’interrompt (censure administrative)

● le sujet a été perdu de vue

QCM2.1• Sur une boite de 258 chocolats, 191 ont été mangés sur une période d’observation maximale de 6 Heures . Que pouvez-vous dire ? (plusieurs réponses)

A. Il s’agit de données non censurées car la durée d’observation est fixeB. Il s’agit de données non censurées car tous les chocolats n’ont pas été mangésC. Il s’agit de données censurées car tous les chocolats n’ont pas été mangésD. Le temps de survie médian d’un chocolat est estimé sur les seuls chocolats mangés.

Réponse : DEn effet, TOUS les chocolats (et pas seuls ceux mangés) contribuent à l’estimation.

QCM2.2• Sur une boite de 258 chocolats, 191 ont été mangés sur une période d’observation maximale de 6Heures. Que pouvez-vous dire ? (plusieurs réponses)

A. Il s’agit de données non censurées car la durée d’observation est fixeB. Il s’agit de données non censurées car tous les chocolats n’ont pas été mangésC. Il s’agit de données censurées car tous les chocolats n’ont pas été mangésD. Le temps de survie médian d’un chocolat est estimé sur les seuls chocolats mangésE. Le délai de survie du chocolat est aussi son délai de mort

Réponses : C et E.

B) L’estimation de Kaplan Meier

Cette estimation de la fonction de survie est définie par

La courbe de Kaplan-Meier est équivalente à la fonction de survie. Elle permet d’estimer la probabilité de survie à chaque instant t si l’on est encore vivant à t-1. Cet outil d’estimation prend en compte certaines données censurées, principalement les données censurées à droite.

• Pour les décédés : le délai de « survie » est observé.

Ronéo 9 UE11 cours 4 8

Page 9: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

• Pour les vivants : le délai de survie (non observé) est au moins supérieur à leur durée de participation. Ainsi, il est dit « censuré (à droite) ».

• Si la censure est indépendante de la mortalité des individus, elle est dite « non informative »

Chaque marche indique la survenue d’un (ou plusieurs) décès. Il n’y pas d’estimation après le dernier suivi.

Chaque sujet participe à cette construction jusqu’à la fin de son observation

Il n’y a donc aucune estimation après l’arrêt du suivi du dernier patient.

S(t) : Donne pour chaque temps t, la proportion estimée de patients en vie

En terme de survie, l’incidence, qui mesure la vitesse d’apparition des nouveaux cas dans la population, détermine une mesure des risques.

• En général, il faut mesurer une incidence cumulée, qui représente la Proportion cumulée de sujets avec (ou sans) événement en fonction du temps.

La fonction de survie s’interprète comme une incidence cumulée S(t) = P(T>t)

Ronéo 9 UE11 cours 4 9

Page 10: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

Exemple

Calcul de la probabilité de survie S(t) à chaque moment:Après le temps 1, P(T>1)=1 car aucun événement n’a eu lieu donc S(1)=1 (de même pour 2 et 3)Puis P(T > 4) = 4/5 = 0.8 P(T > 5) = P(T>5 | T>4)xP(T>4)= 1x4/5 = 0.8 P(T > 7) = P(T>7 | T>5)xP(T>5)= 2/3 x0.8= 0.53 • P(T > 8) = 0.53 P(T > 10) =0.53

QCM 3 Que peut on dire de cette courbe?A) Il s’agit d’une estimation de Kaplan-Meier du délai de survie d’un chocolat.B) Chaque marche d’escalier indique une censure.C) A 2H, il reste 47 chocolats dans la boite des Roses.D) Le délai médian de survie d’un chocolat est approximativement de 2HE) A 4H, 40% des chocolats de Quality street ont été mangés

Réponses : A/C/DA) VRAI. Il s’agit d’une estimation de

Kaplan-Meier du délai de survie d’un chocolat

B) Faux. Non ! Chaque marche indique

Ronéo 9 UE11 cours 4 10

Page 11: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

la survenue d’un ou plusieurs décès.C) VRAI. A 2H, il reste 47 chocolats dans la

boite des Roses.

D)VRAI.Le délai médian de survie d’un chocolat est approximativement de 2H

E) Faux. 40% sont vivants mais n’ont pas été mangés !

Remarques 1) Si la courbe ‘’tombe’’ sur 0 :→ Soit tous les individus sont décédés (pas de censure)→ Soit le sujet qui a le suivi le plus long est décédé.

2) L’aire sous la courbe de survie est la moyenne de survie.→ Mais l'estimation est biaisée si la dernière observation est censurée.

QCM 4 Que peut on dire à la lecture de ce tableau ?A) La survie médiane des chocolats

en secteur médical est de 96 minutes

B) 96% des chocolats ont été mangés

C) 95% des médecins de ce secteur ont mangé les chocolats entre 83 et 109 minutes

D) La boite de chocolats a été observée pendant 6HE) 50% des chocolats ont été mangés en au plus 1H et 36 minutes

Réponses : A/D/EA) VRAI. Cf deuxième ligne du tableauB) Faux. La survie médiane des chocolats est de 96 minutes.C) Faux. C’est l’intervalle de confiance à 95% qui donne les valeurs plausibles de la médiane conditionnellement aux données.

Ronéo 9 UE11 cours 4 11

Page 12: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

D) VRAI. Cf première ligne du tableauE) VRAI. Cf deuxième ligne du tableau.

Quelque soit le temps de suivi (date fixe ou non) :→ Que l’on s'intéresse à une prévalence, ou une incidence cumulée, ces estimations n’ont de sens que dans une population homogène. Or il peut exister des différences (ex: prévalence des décès hospitaliers selon l’année, selon l’USI, selon les caractéristiques des patients ..)

III) Modèles de comparaison et de régression

Comment expliquer (prédire) la survie (mortalité)?

Comparaison → Le plus simple reste la comparaison des morts et des vivants.→ Pour Comparer 2 courbes de survie, on utilise le Test du log-ran

Le But est de tester l’égalité des 2 distributions de survie (et non de 2 taux de survie à un temps donné). C’est un Test « non paramétrique » : aucune hypothèse à vérifier !

→ En dehors d’une CENSURE NON INFORMATIVE On a une Puissance maximale si les risques de décès des 2 groupes sont proportionnels au cours du temps. → Attention si les courbes se croisent !

Principe: Généralisation du test du χ2 de Mantel-Haenzel → Construction de k (k = nombre de temps d’événements) tables 2x2

→ Sous (H0) taux de décès commun et conditionnel aux marges

Ronéo 9 UE11 cours 4 12

Page 13: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

Exemple Kaplan-Meier permet d’estimer la survie, et log rank est utilisé pour calculer la probabilité cumulée de continuer à respirer naturellement pour les 2 groupes.

Un sujet avec NIMV a une cote d’intubation 0,12 fois plus faible.Un sujet sans NIMV a une cote d’intubation 8,3 plus élévée.

Limites:→ Comparaisons multiples→ Non prise en compte d’éventuels facteurs de confusion • Intéret des « modèles de régression

Intérêts des modèles de ‘’régression’’:→ Permettent de décrire la distribution d’une variable aléatoire en fonction de paramètres supposés non aléatoires → Soit on « binarise » les données (vivant, décédé) et on utilise un modèle de régression logistique. → Soit on utilise un modèle de régression pour les données de survie (Cox).

Regression Modèles de régression : Les modèles de régression linéaire et logistique ont déjà été vus dans le cours 2. Ces modèles ne prennent pas en compte les données censurées.

Modèles de régression pour des délais de survie :

1) Modèle adapté à la variable à expliquer

Ronéo 9 UE11 cours 4 13

Page 14: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

→ Permet d’estimer le risque instantané de décès en fonction du temps et de covariables→ Probabilité de décès dans un petit intervalle de temps, sachant qu’on était en vie au début de l’intervalle

2) Modèles dits « de survie »→ Le plus utilisé est le modèle de Cox (1972)→ Suppose des sujets exposés à un seul risque d’événement (censure non informative)

Modèle de Cox C’est le modèle de régression pour des données censurée.

→ Estimation d’un effet de traitement ajusté sur des covariables pronostiques→ Explique le risque instantané de décès en fonction de covariables (fixes, mesurées lors randomisation, ou variables au cours du temps)→ Suppose que l’effet du traitement est fixe dans le temps (« proportionnalité des risques »)

Le But est d’établir une force d’association qui est mesurée par les rapports de risque instantané d’évènement (HR). Régression : influence de variables Zi sur 𝜆(t)→ Formulation :

Intérêt : modèle semi-paramétrique

● La fonction de risque de base n’est pas estimée● Il évite d’avoir à supposer un modèle paramétrique● Seul l’effet des covariables sur 𝜆(t) est modélisé

→ Donne généralement de bons résultats.QCM 5 Soit le texte suivant :

Sur le modèle de régression utilisé par les auteurs, quelle affirmation est fausse ?

A) Il s’agit d’un modèle de CoxB) C’est un modèle de régression

Ronéo 9 UE11 cours 4 14

Page 15: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

C) C’est un modèle pour données censuréesD) Il permet d’estimer des HRE) Il permet d’estimer des OR

Réponse: EIV) Risque relatif et Hazard Ratio

Le hazard ratio (HR)

Définition : risque relatif de survenu d’un événement (≠ survie qui est la mesure du risque de non événement

Calcul:→ Si X est binaire:Si X=1 : 𝜆(t)= 𝜆(t) exp(b)Si X=0 : 𝜆(t)= 𝜆0(t) exp(0)= 𝜆0(t)

exp(b) : rapport des risques instantanées (hazard ratio HR) pour un sujet avec X=1 par rapport à un sujet X=0

→ Si X est une variable continueexp(b): HR de 2 sujets différant en X d’une unité

Interprétation:Si HR=1: pas d’associationSi HR>1 : association positive→ Le risque d’événement augmente avec la valeur de XSi HR<1: association negative→ Le risque d’événement diminue avec la valeur de X

En pratique:• Appréciation (HR=1 vs HR =1) selon un test statistique--> Test significatif si l’intervalle de confiance ne contient pas 1• Le sens de la relation est donné par les donnéesHypothèses sous jacentes ?

→ Modèle log-linéaire𝜆(t)=𝜆0(t) exp(b1 X1 + b2 X2 + ...)

→ Modèle à risque proportionnelL’Effet est constant pour une variation d’une unité de chaque covariable

Ronéo 9 UE11 cours 4 15

Page 16: L3 BICHAT 2019-2020 - Accueil · Web viewAnalyse de données A) Les Données censurées B) Estimation de la fonction de survie de Kaplan Meier III) Modèles de comparaison et de régression

QCM 6

Que pouvez vous conclure à la lecture de ce tableau ? (une ou plusieurs réponses)A) Les Roses sont mangés plus vite que les Quality Street chez tous les médecinsB) Seuls les médecins généralistes préfèrent les Quality StreetC) La valeur pronostique de la marque des chocolats n’est pas vérifiée chez les

hématologuesD) Le HR peut s’interpréter comme un RRE) On aurait envie de tester l’interaction entre boite et type de médecins/chirurgiens

Réponses : B/C/D/EA) Faux. Le HR chez les hématologues est supérieur à 1. Les roses sont donc mangés

plus vite que les quality street seulement pour les hématologues.B) VRAI. c’est le seul HR à être significatifC) VRAI.D) VRAI.E) VRAI.

Interaction : les effets (d’un traitement, d’un facteur d’exposition/pronostic) diffèrent selon une caractéristique de la maladie/ de l’étude.

● Conclusion ● Toujours s’interroger sur la question posée

○ Prévalence/incidences ● Et les implications pour le recueil de données

○ Événements seuls/Dates ?● Bien sur, ne pas oublier les covariables d’intérêt

○ Modifiant possiblement la survenue de ces événements

Ronéo 9 UE11 cours 4 16