Design d’une étude métabolomique

Post on 21-Jun-2022

5 views 0 download

Transcript of Design d’une étude métabolomique

p. 1Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Design d’une étude métabolomique

Binta Diémé, IR biologiste en analyse de données, PFEM

p. 2Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

I. Généralités: historique, définitions

II. Les différents types d’études métabolomiques

III. Les outils analytiques

IV. Le prétraitement des données analytiques

V. Les analyses statistiques

VI. Interprétation des résultats

Plan

p. 3Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Roger Williams

Concept de « profil

métabolique » 1940

Linus Pauling

Utilisation de « profil métabolique »

(GC/MS) 1971

Jeremy K Nicholson

Utilisation de « profil métabolique » (RMN)

1984

Profil métabolique urinaire sur papier chromatographique

Profil métabolique urinaire par GC/MS

Profil métabolique du sérum par 1H-RMN

Utilisation du terme « métabolome »

1988Stephen G. Oliver

Généralités: historique

p. 4Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Métabolome

Ensemble des petites molécules (< 1500 Da) présentes dans un échantillon biologique.

Métabolomique

Définition (Fiehn et al. Nat. Biotechnol.,

2000) :

Identification et quantificationexhaustive et non sélective detous les métabolites d’unsystème biologique.

Généralités: définition

p. 5Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Tiré thèse Aurélie Roux (Roux 2011)

Généralités: domaines d’application de la métabolomique

p. 6Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Sadras & Richards Journal of Experimental Botany, 2014

p. 7Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Zacharias et al.,Electrophoresis (2013), 34, 2762–2775

Untargeted Analysis Targeted Analysis

Les différents types d’études métabolomiques

p. 8Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Protocole biologique

Méthode Analytique

Extraction et alignement

Analyse statistique Identification Interprétation

m/z80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500

%

0

100

T1_220909_101109AFAMM 375 (11.814) Cm (280:402) 1: TOF MS ES+ 3.34e4289.2036

33362

79.02475850

271.19415124

255.16894556

253.18213009

181.11312203

159.07241498111.0227

1052 230.0992;787

465.229532595

363.201123490

301.204921124

317.208017148

335.219213449

393.22615939

394.2391807

431.2523493

466.24654619

467.2661773 492.3099

9

m/z80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500

%

0

100

T1_220909_101109AFAMM 375 (11.814) Cm (280:402) 1: TOF MS ES+ 3.34e4289.2036

33362

79.02475850

271.19415124

255.16894556

253.18213009

181.11312203

159.07241498111.0227

1052 230.0992;787

465.229532595

363.201123490

301.204921124

317.208017148

335.219213449

393.22615939

394.2391807

431.2523493

466.24654619

467.2661773 492.3099

9

m/z80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500

%

0

100

T1_220909_101109AFAMM 375 (11.814) Cm (280:402) 1: TOF MS ES+ 3.34e4289.2036

33362

79.02475850

271.19415124

255.16894556

253.18213009

181.11312203

159.07241498111.0227

1052 230.0992;787

465.229532595

363.201123490

301.204921124

317.208017148

335.219213449

393.22615939

394.2391807

431.2523493

466.24654619

467.2661773 492.3099

9

Sélection des ions VIP

Voie métaboliquemodifiée:

Interprétation biologique

Matrice de données

RT Masse Echantillon1 Echantillon2

Echantillons Biologiques

Empreintes métaboliques

XCMS, Mz line, Markerlynx…

Kegg, HMDB, Metlin

Objectif(s) scientifique(s)

BIOLOGISTES ANALYSTES BIOINFORMATICIENS STATISTICIENS

ANALYSTES BIOLOGISTES

Valorisation(s)

Workflow d’une étude métabolomique

p. 9Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 1: questions biologiques

Etape 2: design de l’étude

Mise au point du modèle expérimental:

• Modèle in vitro: cultures cellulaires, microorganismes

• Modèle animal

Fluides biologiques: urine, plasma, sang, salive, LCR etc.

biopsies

Plantes

p. 10Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 2: design de l’étudeFluides et tissus biologiques humains: urine, plasma, LCR etc.

• Sexe

• Age

• Alimentation

• Prise médicamenteuse

• Exercice physique

• Heure du prélèvement

Plantes• Saison de prélèvement

• Lieu de prélèvement

• Conditions climatiques

Etape 1: questions biologiques

p. 11Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Prélèvement d’échantillons biologiques:

• Dépend de la nature de l’échantillon

• Doit être le plus court possible

• Puis l’aliquotage des échantillons (si fluides biologiques) permet de limiter les cycles congélations/décongélations

Stockage

• Congélateurs -80°C

Etape 3: recueil et stockage des échantillons

p. 12Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 1: question biologique

Randomisation de la préparation et de l’analyse des échantillons

Garder au maximum la chaine de froid

Etape 2 : design de l’étude

Etape 3 : préparation des échantillons

p. 13Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

La préparation des échantillons dépend:

du type de matrice à analyser• Solide: cellules, tissus, microorganismes

• liquide

du type de composés à analyser• Polaire, apolaire…

de la plateforme analytique• RMN

• MS (dérivation chimique pour la GC/MS par exemple)

• Les deux?

Etape 3 : préparation des échantillons

p. 14Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Renseigner au maximum les métadonnées:

• caractéristiques de l’échantillon,

• conditions de prélèvement ou de récolte

• Conditions de stockage et d’analyses

Extraire de manière répétable les métabolites

Pas de protocole universel d’extraction des métabolites

Outils analytiques complémentaires

Points clés

p. 15Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Les outils d’analyse: la spectrométrie de masse

p. 16Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

C’est une méthode de mesure des rapports masse sur charge de molécules ionisées

Source d’ions Analyseur Détecteur

Permet la production d’ions en phase gazeuse

Sépare des ions en fonction de leur

rapport m/z

Convertit d’un courant ionique en courant

électrique

Sous vide

A pression atmosphérique

Basse résolution

Haute résolution

Ultra haute résolution

La spectrométrie de masse

p. 17Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Source d’ions

Permet la production d’ions en phase gazeuse

Sous vide• Ionisation par impact électronique (EI): ionisation dure• Ionisation chimique(CI): ionisation douce

A pression atmosphérique• L’ionisation chimique à pression atmosphérique (APCI): composés

apolaires• Ionisation par électrospray (ESI): composés polaires

Objectif: ioniser et vaporiser les molécules

La spectrométrie de masse : la source d’ions

p. 18Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Analyseur

Séparation des ions en fonction de leur

rapport m/z

Basse résolution

Haute résolution

Ultra haute résolution

Objectif: séparer les ions selon leur rapport masse/charge

Principales caractéristiques d’un analyseur:• La résolution R• La gamme de masse (m/z) qu’il peut analyser• La rapidité de balayage en m/z• La sensibilité

La spectrométrie de masse : les analyseurs

p. 19Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Analyseur Résolution (m/Δm, FWHM) Exactitude en masse (ppm)

Quadripôle 3 000 200

Piège à ions (2D/3D) 5 000 200

Temps de vol 8 000-80 000 1-10

Orbitrap® Jusqu’à 280 000 <2

FT-ICR Jusqu’à 10 000 000 <1

Les analyseurs: résolution

Tiré du MOOC de métabolomique

p. 20Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Lokhov et al., PLoS ONE (2014), 9 (9), e105343

Complexité d’un spectre de masse: sans séparation chromatographique

p. 21Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

RT: 0.00 - 23.00

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Time (min)

0

5

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95

100

Re

lative

Ab

un

da

nce

15.02

14.49

1.25 1.30

17.93 19.1519.501.55 11.06 17.90 20.7619.6515.39

21.3816.587.500.99 22.7317.41

15.5111.20

15.7514.286.5011.376.41 10.87 13.66

2.04 13.5811.732.1310.673.61 8.056.893.65 10.152.29 8.28

4.28 5.000.30

NL:7.51E7

TIC F: FTMS + p ESI Full ms MS ScanPoolobj1_pos

ScanPoolobj1_pos #1353 RT: 7.47 AV: 1 NL: 4.57E6F: FTMS + p ESI Full ms

50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000

m/z

0

5

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95

100

Re

lativ

e A

bu

nd

an

ce

188.07057

205.09715

118.06516

146.05995

100.07567

60.04455

224.12796 271.26294 409.18683342.15585 527.05463447.13623 694.91998 923.13580889.93677

Complexité d’un spectre de masse: avec séparation chromatographique

p. 22Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Chromatographie liquide

Chromatographie gazeuse

Phases inverses

Phases normales

Phases hydrophiles

Colonnes capillaires

Basse résolution

• quadripôles

Haute résolution

• ToF

• Orbitrap

Ultra haute résolution

• FT-ICR

Les couplages chromatographiques

p. 23Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Chromatographie liquideAvantages de la LC-MS

• Analyse de composés polaires, thermolabiles et ioniques

• Accès à l’ion moléculaire• Préparation de l’échantillon réduite

(dans certains cas)

Inconvénients de la LC-MS• Ionisation douce• Spectres de fragmentation peu

reproductibles

Chromatographie gazeuseAvantages de la GC-MS

• Analyse de composés apolaires et volatiles• Spectres de fragmentation reproductibles

Inconvénients de la GC-MS• Préparation de l’échantillon plus longue• Fragmentation intensive (EI), pas d’accès à

l’ion moléculaire

Inconvénients communs• Encrassement des sources• Vieillissement des colonnes chromatographiques• Phénomène de suppression d’ions

Les couplages chromatographiques

p. 24Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Tiré du MOOC de métabolomique

Avantages de la spectrométrie de masse

p. 25Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 4 : analyse des échantillons

Etape 5 : Extraction des données

CAMERAAnnotation of

AdductFragments and

isotopes

Logiciels commerciaux:Progenesis®MS-Processor®Markerlynx®MassHunter®MassProfiler®Compound Discoverer®

Logiciels gratuits:MZmineOpenMSMetAlignMSFACTSMSClust

RT1-MS1 RT2-MS2 … RTX-MSx

Patient 1 Int11 Int12 Int1X

Patient Y IntY1 IntY2 IntYX….

Echantillon

Extraction des données en SM

p. 26Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 5 : Extraction des données

Etape 6 : Correction dérive du signal

Dunn et al., (2011). nature protocols. 6, 1061-1083

Table de données

Filtres• CV échantillons > CV CQ• CV CQ <30 %• Ratio signal Echantillon/Blanc >3

Correction de la dérive du signal analytique en SM

p. 27Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

RT: 0.00 - 31.01

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30

Time (min)

0

10

20

30

40

50

60

70

80

90

100

0

10

20

30

40

50

60

70

80

90

100

Rel

ativ

e A

bund

ance

1.57

1.67

12.22 16.601.31

12.111.88 9.56

23.0022.882.98 8.80 23.1410.0129.2720.2820.02 20.403.15 11.36 23.5014.65 29.528.01 10.27 16.113.55 19.1714.08 28.897.383.89 23.965.04 17.66 24.78 25.64 28.671.01

1.68

10.982.39 10.84 14.742.45

2.54

2.62

2.69

3.17

12.961.50

12.33 23.2014.07 23.349.07 9.698.05 15.847.003.48 22.916.79 24.28 29.0124.8922.2716.713.97 21.20 25.9317.20 28.78 29.9420.065.260.13

NL:3.10E9

TIC F: FTMS + p ESI Full ms [66.70-1000.00] MS Pool5

NL:2.29E9

TIC F: FTMS - p ESI Full ms [66.70-1000.00] MS pool5

Echantillons biologiques

Extraction des données

Filtres

Table de données

m/z , TR , et intensités

Table de données

m/z , TR , et intensités

identification métabolites

discriminants: fragmentation

MS2

Randomisation

Analyses statistiques

CQ: mélange des échantillons

Echantillons analytiques

Extraction des métabolites

Interprétation biologique

Workflow en spectrométrie de masse (SM)

p. 28Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

TP conversion de fichiers

p. 29Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Les outils d’analyse: la résonance magnétique nucléaire

p. 30Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Le spin est une des propriétés des particules, au même titre que la charge et la masse

Le spin caractérise le magnétisme du noyau

Le spin total dépend du nombre de particules dans le noyau (protons et neutrons) de l’isotope

Concepts Physiques: spin

p. 31Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

s Masse atomique Numéro atomique

Demi-entier impaire Pair/impair 1H, 13C

Entier paire impair 2D, 14N

Nul paire pair 12C, 16O

Noyau Spin

1H 1/2

2H 1

14N 1

15N -1/2

13C 1/2

17O -5/2

Concepts Physiques: spin

p. 32Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Le rapport gyromagnétique (𝛾) est une caractéristique de chaque noyau atomique

Au moment cinétique de spin 𝑆 est associé un moment magnétique dipolaire µ

µ

µ = 𝛾 Ԧ𝑆

Concepts Physiques: moment magnétique

p. 33Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

𝐵0

𝛼

𝛽

Absence champ magnétique présence champ magnétique

Concepts Physiques: moment magnétique vs champ magnétique

p. 34Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

z

x

y

z

x

y

𝐵0 𝐵0 Moment magnétique résultant𝑴0

Moments magnétiques µ parallèles à 𝐵0

Moments magnétiques µ anti-parallèles à 𝐵0

𝑀 =

𝑁

µ = 𝑀0

Concepts Physiques: magnétisation

p. 35Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

𝐵0

Moment magnétique résultant𝑴0

Relaxation longitudinale T1

M0𝐵0

M0

𝐵0

x

y

z

x

y

Relaxation transversale T2

RF

Principe d’une expérience de RMN standard

p. 36Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Claridge, 2009

Le signal RMN

p. 37Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Pr. W. Reusch

Représentation schématique de l’appareillage RMN

p. 38Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Ethanol: CH3 CH2 OH

Structure d’un spectre 1D 1H

p. 39Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Nature du noyau• Fréquence de résonance

• Déplacement chimique

Nombre de noyaux résonant à la même fréquence• Concentration de la molécule

Nombre de noyaux des groupements voisins• Multiplicité des signaux

Les informations contenues dans un spectre RMN

p. 40Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Les plus utilisés sont les spectromètres à haut champ

Caractéristiques d’un spectromètre:• La sensibilité et la résolution augmentent avec le champ magnétique

• Grand nombre de noyaux observables

• Expériences en 2D

Ils permettent d’analyser:• Des biofluides

• Des extraits solubilisés

• Tissues ou des biopsies

La RMN: les spectromètres

p. 41Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

RMN SM

• Robuste• Pas de préparation de l’échantillon• Quantitative

• Moins robuste• préparation de l’échantillon ++• Semi-quantitative

Sensibilité faible Sensibilité élevée

RMN SM

Les techniques analytiques

p. 42Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Echantillons biologiques

Analyses par RMN

1.01.52.02.53.03.54.04.5 ppm

1.01.52.02.53.03.54.04.5 ppm6.57.07.58.08.5 ppm

6.57.07.58.08.5 ppm

Control

ASD

• Calibration• Phasage

• Alignement• Normalisation• Bucketing

Table de données

Euceda and al., Scandinavian Journal of Clinical and Laboratory Investigation 2015, 75, 193-203.

identification métabolites: RMN

2D

Analyses statistiques

Workflow en RMN

9.495 9.485 … 0.5

Echantillon 1 Int11 Int12 Int1X

Echantillon Y IntY1 IntY2 IntYX

Echantillon…

.

p. 43Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 1: question biologique

Etape 2 : design de l’étude

Etape 3 : préparation des échantillons

Ajout de solvant deutéré à l’échantillon solide (tissus, cellules) ou liquide (urines)

Utilisation de solutions tampons

Ajout d’un standard externe (TSP, DSS…)

Préparation d’échantillons biologiques en RMN

p. 44Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etape 4 : analyse des échantillons

Etape 5 : Extraction des données

Solutions commerciales:AMIX®Icoshift® sous MatlabMestRenova®

Solutions gratuites:NMRProcFlowW4M

Extraction des données en RMN

p. 45Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Analyse par 1H-RMN de 77 liquides céphalo-rachidiens (LCR) de différents patients (collaboration du Dr Pariente Jérémie et Christian Vincent; et hôpitaux de Toulouse)

Cruz, T. et al.(2014). Metabolites. 4, 115-128.

Etude de LCR de patients d’Alzheimer par 1H-RMN

p. 46Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Le pH du LCR évolue naturellement dès son prélèvement• Au moment du prélèvement il est entre 7.4 et 7.6

• Après 2h à 4°C il peut atteindre 9.6

Des variations de pH entrainent des déplacements chimiques de certaines molécules

Cruz, T. et al.(2014). Metabolites. 4, 115-128.

Etude de LCR de patients d’Alzheimer par 1H-RMN

p. 47Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etude de LCR de patients d’Alzheimer par 1H-RMN

Cruz, T. et al.(2014). Metabolites. 4, 115-128.

p. 48Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etude de LCR de patients d’Alzheimer par 1H-RMN

Cruz, T. et al.(2014). Metabolites. 4, 115-128.

p. 49Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Etude de LCR de patients d’Alzheimer par 1H-RMN

Cruz, T. et al.(2014). Metabolites. 4, 115-128.

p. 50Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Cruz, T. et al.(2014). Metabolites. 4, 115-128.

Etude de LCR de patients d’Alzheimer par 1H-RMN

p. 51Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Le contrôle du pH est primordial dans le LCR

Mauvaises interprétations des résultats biologiques

Importance d’éviter tout biais analytique

Etude de LCR de patients d’Alzheimer par 1H-RMN

p. 52Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Les analyses statistiques

p. 53Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Tableaux d’informations

p. 54Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Analyses univariées

Analyses multivariées:• Modèles descriptifs (ou modèles non supervisés)• Modèles supervisés

Sélection p-value <0,05

Sélection par métabolites discriminants

Table de données

Identification variables discriminantes

Interprétation biologique des résultats

Analyses statistiques

p. 55Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Statistiques descriptives: décrire, résumer, synthétiser l’information contenue dans les données

• Univariées

• Multivariées (modèles non supervisés)

Statistiques inférentielles ou décisionnelles: extrapoler à la population entière les propriétés mises en évidence sur l'échantillon

• Univariées

• Multivariées (modèles supervisés)

Analyses statistiques

p. 56Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Statistiques univariées

p. 57Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Population Statistiques: - Moyenne - Médiane- Ecart-type- Coefficient de

variation- Etc.

Statistiques univariées : statistiques descriptives

p. 58Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Statistiques univariées : statistiques descriptives

Tiré du MOOC de métabolomique

p. 59Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Statistiques univariées : statistiques descriptives

p. 60Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Population

Statistiques inférentielles

Echantillon

Statistiques univariées

p. 61Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Objectifs: extrapoler à la population entière les propriétés mises en évidence sur l'échantillon

• Tests d’hypothèses• La loi de distribution

• Méthodes d’échantillonnage: cruciales pour éviter tout biais

Statistiques inférentielles ou décisionnelles

p. 62Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé © Marie-Tremblay-Franco

Statistiques inférentielles ou décisionnelles

p. 63Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Statistiques multivariées

p. 64Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Tableau de données métabolomiques

p. 65Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Objectifs:

résumer et visualiser l’information pertinente contenue dans un grand tableau de données

Mettre en évidences des liens potentiels entre les variables

Identifier de regroupements d’individus similaires

Mettre en évidence des individus atypiques

Statistiques multivariées descriptives ou non supervisées

p. 66Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Méthodes descriptives Variables quantitatives Variables qualitatives/mixtes

Les méthodes factorielles: Visualiser les corrélations multiples entre les variables et/ou les individus

Analyses en composantes principales (ACP)

Analyses factorielles des correspondances (AFC, AFCM)

Les méthodes de classification: réduire le nombre d’individus en groupes homogènes

Classification hiérarchiqueascendante

AFC ou AFCM et classification

Statistiques multivariées descriptives ou non supervisées

p. 67Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

L’analyse en composante principale (ACP):

réduire la dimensionnalité en perdant le moins d’information possible

• les composantes principales sont des combinaisons linéaires des variables d’origines centrées

• Projection du nuage de points sur une surface plane

Statistiques multivariées descriptives

p. 68Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

I1

I2

I3

X1

X2

X3

I1

I2

I3

X1

X2

X3

X =

Espace des individusEspace des variables

Statistiques multivariées descriptives : ACP

p. 69Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Composante principale = somme pondérée des variables d’origine centrée

Un poids est associé à chaque variable, ce poids peut être positif ou négatif

X1

X2

X3

Espace des individus

I1*I2*

I3*T2

T1

Ti= wi1X1+ wi2X2 + wi3X3 …… + wikXk

I1

I2

I3

Analyse en Composantes Principales

p. 70Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

D’un point de vue géométrique : construction d’une série d’axes orthogonaux permettant de projeter le maximum de variabilité des données sur un plan à 2 dimensions. (techniquement : maximise la variance projetée sur les axes)

Statistiques multivariées descriptives: ACP

p. 71Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

t31

t32

t21

t22

t12

t11

W2

W1

I1*I2*

I3*T2

T1

X1*

X3*X2*

w21

w11

w23

w13

w22

w12

Scores plot Loadings plot

Analyse en Composantes Principales

p. 72Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Discrimination des trois aliments (97 % de la variabilité totale) Mise en évidence des métabolites majeurs discriminants les aliments Effet spécifique de chaque aliment sur le métabolisme des truites?

45 variables ( Concentrations des métabolites), 36 échantillons, Normalisation centrée réduite

Jour de fabricationDébut de l’essaiFin de l’essai

PC2 = 24%

PC1= 69%

Végétal

Marin

Commercial

Scores plot Loadings plot

Stage Master 2 Blandine Madji Hounoum

ACP sur les concentrations des métabolites d’extraits polaires d’aliments

p. 73Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé 73

Classification hiérarchique ascendante• Mesure de distance ou dissimilarité entre les individus

Objectifs: regrouper les individus en groupes homogènes

Kristian Hovde Liland, Trends in Analytical Chemistry, Vol. 30, No. 6, 2011

Statistiques multivariées descriptives: classification ascendante hiérarchique

p. 74Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Variables explicatives

Objectif: expliquer la variable Y à partir des variables explicatives X

X =

Y11

Y21

Y31

Y =

𝑓 𝑋 = 𝑌

Statistiques multivariées supervisées

p. 75Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Statistiques multivariées supervisées

Partial Least Squares (PLS):

réduire la multidimensionnalité en perdant le moins d’information possible (comme pour l’ACP)

• Variables latentes: maximisent la covariance entre X et Y

• Projection des nuages de points sur une surface plane

p. 76Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Études méthodologiques: • Optimisation du protocole de préparation des échantillons

• Optimisation de(s) méthodes statistique(s)

Études non ciblées• Détection du maximum de composés afin de :

• Rechercher un ou plusieurs biomarqueurs (modèles prédictifs)

• Rechercher des voies métaboliques perturbées (modèles explicatifs)

Études ciblées:• Recherche spécifique de composés appartenant à une ou plusieurs voies métaboliques

• Quantification de composés biomarqueurs

Différents types d’études métabolomiques

p. 77Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Jan van der Greef et al., Current Opinion in Chemical Biology, (2004), 5, 559-565

Différents types de biomarqueurs

p. 78Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

PLS-DA

Sélection de variables

Identification des variables

Validation sur cohorte externe

Modèles prédictifs: recherche de biomarqueurs

p. 79Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Boiterie chez les vaches:

• Forte prévalence chez les vaches laitières

• Souffrance animale

• Pas de symptômes avant l’apparition de la maladie

Objectifs: mettre en évidence des biomarqueurs précoces avant l’apparition de la boiterie chez les vaches

Protocole d’expérience:• Prélèvement d’échantillons de sang de la vache à différents temps pendant la gestation et

après la mise bas. Zhang et al., Animals (2015), 5, 717-747.

Exemple : recherche de biomarqueurs précoces de la boiterie chez les vaches

p. 80Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Construction d’une série d’axes (composantes principales) permettant de maximiser la variance entre les individus

Zhang et al., Animals, (2015), 5, 717-747.

ACP

PLS-DA

Visualisation du lien entre les variables quantitatives X et les variables qualitatives (groupes).

Classification des variables (score VIP) par ordre décroissant

Exemple : recherche de biomarqueurs précoces de la boiterie chez les vaches

p. 81Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Études méthodologiques: • Optimisation du protocole de préparation des échantillons• Optimisation de(s) méthodes statistique(s)

Études non ciblées• Détection du maximum de composés afin de :

• Rechercher un ou plusieurs biomarqueurs (modèles prédictifs)• Rechercher des voies métaboliques perturbées (modèles explicatifs)

Études ciblées:• Recherche spécifique de composés appartenant à une ou plusieurs voies métaboliques• Quantification de composés biomarqueurs

Différents types d’études métabolomiques

p. 82Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Wirgot et al.,Scientific Reports (2019), 9, 12799

Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage

p. 83Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Wirgot et al.,Scientific Reports (2019), 9, 12799

a) RMN b) LC-MS mode +

Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage

p. 84Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Wirgot et al.,Scientific Reports (2019), 9, 12799

Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage

p. 85Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Wirgot et al.,Scientific Reports (2019), 9, 12799

Adaptations métaboliques de Pseudomonas graminis au stress H2O2 dans l’eau de nuage

p. 86Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Plusieurs logiciels de mis en réseaux des métabolites

• MetExplore: plusieurs organismes dans BDD

• MetaboAnalyst: comparaison de différence de profil d’expression mais peu d’organismes disponibles pour mapper

• KEGG

• iPath 3 …..

Modèles explicatifs: réseaux métaboliques

p. 87Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Études méthodologiques: • Optimisation du protocole de préparation des échantillons

• Optimisation de(s) méthodes statistique(s)

Études non ciblées• Détection du maximum de composés afin de :

• Rechercher un ou plusieurs biomarqueurs (modèles prédictifs)

• Rechercher des voies métaboliques perturbées (modèles explicatifs)

Études ciblées:• Recherche spécifique de composés appartenant à une ou plusieurs voies métaboliques

• Quantification de composés biomarqueurs

Différents types d’études métabolomiques

p. 88Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Ahonen et al., Metabolites, (2019), 9, 184.

Etude clinique ciblée de métabolites pour la stratification de patients diabétiques

p. 89Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Ahonen et al., Metabolites, (2019), 9, 184.

Etude clinique ciblée de métabolites pour la stratification de patients diabétiques

p. 90Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Omiques intégratives

p. 91Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Réseaux métabolites-enzymes-gènes

p. 92Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Métabolisme de la glycine, sérine, thréonine, alanine

p. 93Design d’une étude métabolomique

04-06-2020 / Production at analyse de données métabolomiques / Binta Diémé

Métabolomique:

• Technologie multidisciplinaires

• Applicable a des nombreux domaines de recherche

Cependant

• Précautions à prendre à toutes les étapes du workflow pour éviter les biais

Conclusions générales