Post on 15-Sep-2018
BCM 2003
Département de biochimie et médecine
moléculaire
Matthieu Ruiz, Ph.D., Laboratoire de métabolomique dirigé par le Pr. Christine des
Rosiers, Centre de Recherche de l’institut de cardiologie de Montréal
Partie 1:
Familiarisation avec la théorie sous-jacente à la métabolomique.
Du pourquoi? … au comment?
Cours 1:
Cours 2:
Introduction générale: la métabolomique à l’échelle de l’ome
Notions de base et apercu général des applications
Flux de travail, approche ciblée vs. non ciblée
Les défis d’une analyse métabolomique
Applications diverses, ciblées et non ciblées
Perspectives futures et nouvelles applications
Mise en contexte…
The’omes puzzle, Moya Baker, nature 2013
Vers une approche holistique, c’est à dire que l’on considère un ensemble
d’éléments: “-omes” et on cherche les structures de ces ensembles:
“-omiques”.
Vient en opposition d’une approche descriptive et réductionniste
où l’on ne considère qu’un élément isolé.
Holisme, du grec ancien “hólos” pour entier.
“tenter d’expliquer un phénomène comme étant un ensemble indivisible
puisque la somme de simples parties ne suffit pas à le définir”
Description d’un système complexe avec des caractéristiques ciblées et réductrices
D’une approche réductionniste…
Description d’un système complexe avec des caractéristiques illimitées et
inattendues
Vers une approche holistique…
Approche hollistique en biologie
Ivanisevic J et al, 2015
Dernière pièce du puzzle
Le dogme central de la biologie moléculaire
“Metabolomics reveal changes that take
place as a net result of interactions
between the genome and the
environment and as such bridges the gap
between genotype and phenotype”
Génomique/
Transcriptomique Protéomique Métabolomique
≈ 40 000 gènes ≈ 106 protéines ≈ 20 000 métabolites
Image de l’état fonctionnel
du génome
Mesure de 100 à plusieurs milliers de variables (haut débit)
- Analyse en série
(SAGE)
- Puce à ADN
- Profil d’expression
- Electrophorèse 2D
- Spectrométrie de
masse
- Chromatographie…
Mature “En croissance”
- Spectrométrie de
masse (GC-MS, LC-
MS).
- Ciblée vs. non ciblée
C2-Car
C3 DC-Car
C3-CarC4-Car
C6-Car
d3 C8-Car
C16-Car
C18-Car
d3 C12-Car
Sciences “omiques” et notion de haut débit - 2
Une relation complexe entre le génotype et le phénotype - 1…
1 gène 1 protéine
Approches génie génétique:
Inactivation ou surexpression d’un
gène (bactérie ou animal)
Phénotype parfois imprévisible
Maladies génétiques du métabolisme
1 même déficit enzymatique
Plusieurs phénotypes cliniques
Sous-entend qu’un gène va avoir un seul impact sur une étape unique d’une seule
voie métabolique
“one gene-one enzyme hypothesis”
≈ 40 000 gènes ≈ 106 protéines
Une relation complexe entre le génotype et le phénotype - 2…
Exemple du Syndrome de Leigh version canadienne-française (LSFC)
+ communément: acidose lactique
Syndrome décrit en 1993 par Morin & coll. comme une forme d’acidose
lactique spécifique au Saguenay-Lac-St-Jean
Clinique
Retard psychomoteur
Dysmorphie faciale
Hypotonie
Stéatose hépatique
Lésions cerveau
Episodes d’acidose
sévère (crises)→
hospitalisation → haut
taux de mortalité
Génétique
Monogénique
Gène causal
(2p21) en 2001
LRPPRC (2003)
homozygote
(A354V) ou
hétérozygote
(C1277STOP)
Biochimique
Acidose lactique
Défaut de COX
(complexe 4),
chaine respiratoire
mitochondriale
Activité altérée foie
et cerveau (↘80-90%) et fibroblastes
(-50%)
Métabolisme
“A metabolic
signature (45
metabolites) of
mitochondrial
dysfunction
revealed through a
monogenic form
of LSFC”
Thompson L J et al, 2015
La réponse métabolomique est “time-sensitive”…
Temps
Rép
on
se
Rép
on
se
Rép
on
se
Cest une réponse
dynamique
→ La concentration
des métabolites peut
varier très
rapidement (en s)
→ variation
dépendante de
nombreux facteurs
Une description
métabolomique
détaillée, renseigne sur
les perturbations du
phénotype et relie ce
dernier à un processus
en amont en réponse à
un évènement
(génétique,
pathologique…) à un
temps t bien défini.
Stress
Nutrition Pathologie
Rythme biologique Hormones
Médicaments
Mutation génétique
La fluxomique, une dimension dynamique de la métabolomique
Fluxomique = analyse de flux métabolomique
C’est une approche dynamique de la métabolomique. Vient en opposition à des
mesures statiques (quantification).
Utilisation de substrats
marqués pour sonder
la dynamique du
métabolisme
Quelques définitions utiles…
MÉTABOLITE
Représente l’ensemble
des métabolites
MÉTABOLOME
Représente un composé organique
intermédiaire ou issu du métabolisme et est
restrictif aux molécules de petites taille (<1500
Da)
N.B. Dalton = unité de masse atomique
Détection dans
divers tissus ou
fluides (sang,
plasma, urine,
salive…)
M
É
T
A
B
O
L
O
M
I
Q
U
E
Identification et
quantification
exhaustives et non
sélectives de l’ensemble
des métabolites d’un
système biologique,
lesquels sont issus des
processus de
transformation du
métabolisme
Fiehn O. et al, Nat. Biotech, 2000
0
500
1000
1500
2000
2500
3000
3500
2 19 41 68 120 180 269 400
600
918 1125
1434
1887
2150
2816
3127
La métabolomique, une science en expansion
Pas plus de 100
métabolites détectés.
Surtout dépistage de
maladies génétiques
du métabolisme
Profilage métabolique
Une science d’avenir génératrice de
nouvelles hypothèses
897 en 2016 (au 14.03.16)
Des exemples concrets de métabolites chez l’humain
Répertoriés dans diverses bases de
données dont la plus représentative est
Human metabolome Database
(www.hmbd.ca)
Inclue de nombreuses petites
molécules: sucres, molécules
organiques, lipides,
oligonucléotides, acides
aminés…
Non exhaustif, en évolution…
Métabolomique, émergence fin des années 1990…
Tiré de: Canadian Bioinformatics Workshop
www,bioinformatics.ca (2013)
Vue d’ensemble au sein des réactions du métabolisme
Carte globale des voies métaboliques
Lipides Sucres Acide aminés
Métabolisme énergétique
Nucléotides
Petites molécules
La métabolomique: “the final frontier” ?
Découverte de
biomarqueurs*2
Études
toxicologiques
Études effets/toxicité
médicamenteuse
Nutrition
Identification
maladies
métaboliques
héréditaires*1
Contrôle succès
ou échec greffe
Veenstra TD et al, Genome Medicine, 2012
Outil diagnostique dans le cadre des pathologies héréditaires du métabolisme
Profil métabolomique utilisé pour le diagnostic néonatal de pathologies héréditaires du
métabolisme, en routine
L’apparition d’outils de détection de plus en plus performants a été révolutionnaire
d’un point de vue clinique pour la détection spécifique de maladies génétiques
Urine Sang
Acide-gras (AG) très longue
chaine (peroxisomes)
Syndrome de Zellweger
Acylcarnitines
Déficience oxydation des AG
(mitochondries)
Entre C6 et C10 MCADD
C14:1, C14, C14:2 VLCADD
Rinaldo P et al, Genet med, 2008
C16, C18, C18:1 CPTIID
Acide aminés branchés
“Maladie du sirop d’érable”
Recherche de biomarqueurs-1, exemple du cancer
2009
Sreekumar A et al, nature, 2009
Cernei N et al, Int.J.Mol.Sci., 2013
Concentration élevée dans urine (+
tissus). Identifié comme marqueur de
la progression du cancer de la prostate
GNMT=glycine N-
methyltransferase
Recherche de biomarqueurs-2, exemple du diabète
2011
Wang TJ et al, nature medicine, 2011
BCAA: Leucine,
isoleucine, valine
Aromatic AA: Tyrosine,
phenylalanine
Com
bin
ed s
core
Combined score
HO
MA
-IR
Chen T et al, scientific reports, 2016
Flux de travail général
Identification du
contexte biologique et
choix du compartiment
Préparation de
l’échantillon
Extraction
Conservation
Collection
Acquisition des données
Appareillage
Spectres de masse
m/z ratio
Inte
nsity
Traitement des données
dataset
Listes RT,
m/z,
intensité …
Analyses statistiques
Multivariées
Univariées
Identification, Validation
MS/MS
Bases de données
Signification biologique
Littérature
Bases de données
QC and validation methods
Choix de la technologie - 1. Spectrométrie de masse vs. RMN - 1
Résonance magnétique nucléaire Spectrométrie de masse
On utilise la capacité d’absorbtion/relaxation
(ou résonance) des noyaux atomiques soumis à
un champs électromagnétique
Détection et identification selon la masse et la
charge d’une molécule au préalable ionisée et
caractérisé par une intensité relative
Soit utilisé seule (“shot gun”) soit après
séparation par chromatographie gazeuse
(GC) ou liquide (LC) Non sélectif, rapide, peu ou pas de
préparation d’échantillon. Info sur
structure chimique. Meilleure sensibilité, préparation
échantillon plus complexe
Choix de la technologie - 1. Spectrométrie de masse vs. RMN - 2
ng/ml
μg/ml
pg/ml
Composés
concentration élevée
Composés faible
concentration
Préparation générique
des échantillons
Préparation ciblée des
échantillons
RMN
Spectrométrie de
masse
Nouvelles
générations GC-
MS, LC-MS
acide organiques
lipides
acide aminés
nucléotides
stéroïdes
eicosanoïdes
neurotransmetteurs
peptides
Traces…
Choix de la technologie – 2. GC- ou LC-MS
Moins polaire Plus polaire
MS = mass spectrometry; GC = gaz chromatography; LC = liquid chromatography
Un compromis analytique entre qualité et quantité
Adapté de: Threthewey 2004)
Analyse ciblée: plusieurs composés
d’une seule classe
Nom
bre
de m
éta
bo
lite
s
Analyse ciblée: un métabolite
Analyse non-ciblée: métabolites non
identifiés; profil complexe
Qualité des données
(quantification, précision, sensibilité, identité)
Le métabolome ~20,000 métabolites
Analyse ciblée: plusieurs classes
de métabolites; profil complexe
Métabolomique
Métabolite unique
Profilage
métabolique
Empreinte
métabolique
2 approches distinctes: ciblée vs. non ciblée
Approche
ciblée
Approche
non ciblée
Grand nombre de métabolites (le
plus possible) en simultanné
Approche génératrice
d’hypothèses, découverte
Méthode exploratoire, non
quantitative
Complexité d’analyse et de
traitement de données
Quoiqu’il en soit importance
validation et standardisation
en amont
Nombre de métabolites limité,
souvent métabolites connus,
prédéfinis
Pour répondre à une hypothèse
ou outil diagnostique
Méthode quantitative (ou semi)
Précision et reproductibilité
L’approche ciblée: principe
C2-Car
C3 DC-Car
C3-CarC4-Car
C6-Car
d3 C8-Car
C16-Car
C18-Car
d3 C12-Car
Acquisition des données
1 métabolite est défini par 1
m/z et 1 RT
Analyse des données
Analyses statistiques
Inte
nsité
RT
Liste métabolites avec RT,
m/z (caractéristiques)
Intensité (aire sous la courbe) des
pics caractéristiques
Contrôle qualité
Calcul concentrations
(ratio/standard)
Diverses analyses envisageables dépendament
de l’objectif :
univariée/multivariée, supervisée/non supervisée
Corrélations, analyse de covariance
Métabolites analysés sont préalablement connus;
Échantillons additionnés d’un ou plusieurs standards externes ou internes
Adapté de Roberts LD et al, curr protoc mol biol, 2012
L’approche non ciblée: principe
Acquisition des données
1 métabolite est défini
par 1 m/z et 1 RT
Inte
nsité
RT
Analyse des données
Analyses statistiques identification
Traitement “raw data”
“Peak picking” ou extraction des
pics
Alignement des RT
Liste “entités” : RT, m/z, intensité
Filtre de fréquence : exclusion si un
“feature” sous-représenté
Imputation des valeurs manquantes
sur la base d’une “entité” similaire
Liste identités exprimés
différentiellement + m/z
Volcano plot
PCA
Base de donnée
(METLIN, hmp)+Analyse
MS/MS (ciblée)
Interprétation bio.
Adapté de Alonso A et al, frontiers in bioengineering and biotech, 2015 “pathway analysis”
“databases” utiles pour l’analyse des données …
Alonso A et al, frontiers in bioengineering and biotech, 2015
Update 3.0, Xia J et al, nucleic acid
research, 2015
“databases” utiles pour l’identification d’entités, de métabolites…
Alonso A et al, frontiers in bioengineering and biotech, 2015
+ validation des familles de métabolites clés
par MS/MS
“databases” utiles pour l’interprétation biologique…
Alonso A et al, frontiers in bioengineering and biotech, 2015
+ Une bonne dose de littérature!!
Généralement à l’origine de nouvelles hypothèses et permettant de nouvelles avenues de
recherche
Approches statistiques et de visualisation
+ Volcano plot, largement
utilisé pour les sciences
omiques.
Approches statistiques Approche de visualisation
dif entre 2 groupes ou plus
(normalité vérifiée, test
d’homogénéité des variances)
Permet une simplification d’un large set de données
complexes. Efficace pour sélectionner/détecter une liste de
composés différentiellement exprimés entre 2 conditions
expérimentales
On veut s’affranchir de
l’impact de facteurs
confondants
Analyse de covariance
Focus sur le volcano plot
+ Volcano plot, largement utilisé pour les sciences omiques pour
l’identification rapide de changements entre 2 conditions (surtout avec très
grand “dataset”)
Hur M et al, Nat Prod Rep, 2013
Focus sur l’analyse de composantes principales (ACP) - 1
1. Quelle est l’image qui va représenter le plus l’objet en question?
Associé à un algorithme
mathématique
Information visuelle la plus grande
2 axes (vecteurs)
représentant la plus
grande étendue
(perpendiculaire)
PC1
PC2
2. Simplification d’un objet 3D (réel) en représentation 2D (plan)
Concrètement, méthode dite d’ordination permettant de dégager les grands
axes caractéristiques d’un objet. Représentation sur des axes.
Focus sur l’analyse de composantes principales (ACP) - 2
On réduit le nombre de variables (la dimensionnalité) d’un jeu de donné tout en
conservant le plus possible la variance de ce jeu de donné
3 variables initiales : 3
gènes réduites en 2
“nouvelles variables”
appelées composantes
principales.
Les PCs obtenus sont représentées graphiquement selon 2 axes expliquant la
plus grande variance. PC1 représente la plus grande variance du jeu de
donnés. PC2 représente la plus grande variance restante et s’illustre
orthogonalement à PC1.
Gestion massive de données (surtout lors d’une approche non ciblée)
(Fiehn et al. JBC 2011)
Bases de données
Méthodes statistiques
Logiciels et outils de bioinformatique
Qualité de l’échantillon et contrôle qualité
Collecte et entreposage des échantillons Devis expérimental
4oC Contrôle des conditions: statut
nutritionnel et physiologique,
traitement, exercice/sédentaire,
sexe, âge… Immédiatement
-80oC
Niveaux métabolites changent très rapidement,
variable selon de nombreuses conditions
Il est capital d’établir un devis expérimental cohérent et de s’assurer de
la qualité des échantillons
Rappel
Puis pour plus long
terme