Guillaume van der Rest Laboratoire des Mécanismes ...

Post on 11-Nov-2021

0 views 0 download

Transcript of Guillaume van der Rest Laboratoire des Mécanismes ...

Spectrométrie de masse pour l'étude de systèmes biologiques

Guillaume van der RestLaboratoire des Mécanismes Réactionnels CNRS UMR 7651

Ecole Polytechnique, Palaiseau

Introduction

Causes de l'essor de la spectrométrie de masse en biologie

Protéomique et techniques associées

Méthodes d'analyse structurale

Autres molécules ?

Plan de l'exposé

Causes de l'essor de la spectrométrie de masse en biologie

Protéomique et techniques associées

Méthodes d'analyse structurale

Autres molécules ?

Critères d'intérêt de techniques pour les biologistes

Innovation sur les informations apportées

Travail préparatoire en amont :− Quantité de matériel à obtenir et facilité d'accès à celui-

ci. Par exemple, approche in vitro vs in vivo, ADN plus facile à reproduire (PCR) que protéines.

− Sensibilité peut être un paramètre critique.

Quantité d'informations produites− Débit de la méthode ?− Qualité / reproductibilité des informations obtenues.

Arrivée de la spectrométrie de masse: des modes d'ionisation adaptés

< 1980 : ionisation électronique ou chimique :− Nécessite des composés volatils ou qui ne se dégradent

pas par chauffage.− Possibilité de dérivatisation pour rendre plus volatils.− Encore très utilisé pour métabolites et oligosaccharides.

1980 – 1990 : FAB (fast atom bombardment)− Désorption/ionisation dans une matrice de glycérol.− Premiers travaux sur des peptides ou des petites

protéines. Montre le grand intérêt de la MS en biologie. > 1990 : ESI (et ses variantes) et MALDI

− Point d'entrée réel de la MS en biologie.

Prix Nobel 2002

John FENN Koichi TANAKA

Electrospray MALDI

Ionisation par électronébullisation

Ionisation nanospray

MALI

• Débit de qq nL/min

• Utilisation d’aiguilles remplies de 1-4 μL de solution

• Pas de gaz de nébulisation, température et tensions plus faibles

diamètre de 1-4 μm

picture from http://www.newobjective.com/ 

Ionisation MALDI

Approches possibles

Désolvatation-désorption/Ionisation permet d'étudier ce qui est initialement présent en solution ou dans la matrice.

− Exposé d'aujourd'hui.

Désolvatation-désorption/Ionisation permet de former des espèces ionisées et d'en étudier les propriétés en phase gazeuse.

− Exposé de Valérie Gabélica demain.

Plan de l'exposé

Causes de l'essor de la spectrométrie de masse en biologie

Protéomique et techniques associées

Méthodes d'analyse structurale

Autres molécules ?

Quelques définitions

● Protéome : ensemble des protéines présentes dans une cellule à un instant donné et dans des conditions données.

● L’analyse du protéome (protéomique) regroupe donc

● L’identification des protéines

● La caractérisation de leurs modifications post-

traductionnelles

● L’analyse des protéines en interaction (interactome)

● La quantification des protéines entre deux états cellulaires

différents

Quelques ordres de grandeur

La protéomique

● De la protéomique descriptive● détermination d’un protéome tissulaire, cellulaire, sub-

cellulaire● protéome complet

● … à la protéomique fonctionnelle● pour pouvoir comparer des protéomes (sain vs

pathologique) et identifier les protéines co-stimulées, co-réprimées…

Contrôle modifié

Protocole général pour identifier des protéines

Homogénéisation des tissus, extraction des protéines

Séparation des protéines sur gelsodium dodecyl sulfate (SDS)–polyacrylamide gel electrophoresis (PAGE)

Excision des spots

LavageRéduction/alkylation

ProtéolyseExtraction des peptides

Analyse des peptides

La séparation sur gel

●Utilisation de gels d’électrophorèse monodimensionnels● séparation des protéines en fonction de leur poids

moléculaire (SDS-PAGE)

La séparation sur gel

● Utilisation de gels d’électrophorèse bidimensionnels● 1ère dimension : séparation en fonction du pH (Iso

Electric Focusing)● 2ème dimension : séparation en fonction du poids

moléculaire (SDS-PAGE)

Exemple de gel 2D

La digestion en pièce de gel

Peptides

Les protéases les plus courantes

● Les protéases sont des enzymes qui clivent le squelette polypeptidique de manière ± spécifique

Endopeptidase Type Spécificité pH T°

chymotrypsine Sérine Y, F, W 1.5 - 8.5 37°C

Trypsine Sérine R et K 7.5 - 9.0 37°C

LysC Sérine K 7.5 - 8.5 37°C

ArgC Sérine R 7.5 - 8.5 37°C

GluC Sérine D, E 7.5 - 8.5 37°C

AspN métallo D (Nter) 6.0 – 8.0 37°C

pepsine Acide F, L, M, W 2.0 - 4.0 4°C

Identification de protéines : stratégies bottom-up

Mesure des masses des peptides trypsiques en

mélange(MALDI/MS)

Séparation HPLC puis fragmentation des peptides

pour déterminer des éléments de séquence

(nanoLC – nanoESI - MS/MS)

comparaison entre ces masses et les masses théoriques obtenues par digestion in silico

des protéines des banques de données

interrogation dans les banques de données à partir de ces éléments de séquence

Identification de la protéine

Analyse par Mass Fingerprinting

20

97

66

45

30

kD

Band 1

Band 6

Tumor Metastasis

Band 8

Gel SDS-PAGE (coloration bleu de Coomassie)

881.2564982.7859

1124.59791271.6904

1424.6335

1523.6963

1598.7613

1707.7801

1765.7445

1934.93372018.0265

2164.0563

2226.1627

800 1000 1200 1400 1600 1800 2000 2200m/z

1270.695

1370.723

1447.700

1614.915

1644.875

1668.872

1799.869

1996.926

2017.014

Liste de massesexpérimentales

Banque protéomiqueMATRSDCVFHTYILLLAFTPKLMPCGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTN

GTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMP

HIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMPGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHI

812.695

967.854

1001.789

1112.695

1370.723

1447.700

1614.915

1644.875

1668.872

1799.869

1996.926

2017.014

582.687

597.123

1211.789

1432.65

1370.723

1424.789

1635.874

1776.325

1878.943

1987.974

2067.672

A B

digestion

in silicoA

BC Listes de masses

théoriques

Comparaison par moteur de recherche

Exemple de recherche dans profound

banque de données

protéiques choisie

taxonomie

gamme de masse

nb de site de coupure ratés autorisé

enzyme

modifications

liste des peptides

Mr ou MH+

précision

Résultat de la recherche

meilleur score

masse moléculaire

couverture de séquence

informations sur la protéine

Informations sur l’identification

liste des peptides utilisés pour

l’identification

précision (ppm)

nb peptides trouvés

localisation des peptides dans la séquence

erreur (ppm)

Limite de l’approche par PMF

● Problème si peu de peptides (protéines membranaires)

● Effet de suppression de signal pour les mélanges complexes (gamme dynamique)

● Problème si l’organisme est non séquencé ou les protéines absentes des banques

Identification de protéines : stratégies bottom-up

Mesure des masses des peptides trypsiques en

mélange(MALDI/MS)

Séparation HPLC puis fragmentation des peptides

pour déterminer des éléments de séquence

(nanoLC – nanoESI - MS/MS)

comparaison entre ces masses et les masses théoriques obtenues par digestion in silico

des protéines des banques de données

interrogation dans les banques de données à partir de ces éléments de séquence

Identification de la protéine

Analyse par nanoLC-MS/MS

● 1ère étape : Séparation des constituants du digestat par chromatographie liquide à nano-débit couplée au spectromètre de masse.

Chromatogramme

Analyse par nanoLC-MS/MS

● 2ème étape : Mesure de la masse des peptides au fur et à mesure de leur élution de la colonne.

Spectre MSm/z

100 300 500 700 900 1100 1300 1500

100

%

(1+)

(2+)

785.75

1570.42

Analyse par nanoLC-MS/MS

● 3ème étape : Isolation d’un ion (multichargé) et fragmentation (MS/MS).

300 500 700900 1100 1300 1500

m/z

NDNEEGF

y''6

y''4y''9

y''8 y''11y''10

y' ’7

y' ’5

284.15

100 300 500 700 900 1100 1300 1500m/z

0

100

%

NDNEEGF

y6

y4y9y8 y10

y7

y5

479.10 284.15

Spectre MS/MS

y11

Informations de séquence

100 300 500 700 900 1100 1300 1500m/z

0

100

%

NDNEEGF

y''6

y''4y''9

y''8 y''11y''10

y' ’7

y' ’5

479.10 284.15

Analyse par nanoLC-MS/MS● Dernière étape : Interrogation dans les banques de données à partir des spectres MS/MS

Listes de masses théoriques

100 300 500 700 900 1100 1300 1500m/z

0

100

%

NDNEEGF

y''6

y''4y''9

y''8 y''11y''10

y' ’7

y' ’5

479.10 284.15

100 300 500 700 900 1100 1300 1500m/z

0

100

%

NDNEEGF

y''6

y''4y''9

y''8 y''11y''10

y' ’7

y' ’5

479.10 284.15

Liste de masses expérimentales

480.10

626.90

813.09

1056.32

942.32

1285.25

1171.35

684.20

1570.42MS

MS/MS

Banque protéomiqueMATRSDCVFHTYILLLAFTPKLMPCGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTN

GTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMP

HIAQAQDGFHITTRLEPASFTAVCNFTNMATRSDCVFHTYILLLAFTPKLMPGTREAQCSDERTAHIPLSDCVFHTYILLLAFTPKHHITSELKKMNVSCCDTHI

Digestion et fragmentation

in silicoA

BC

Comparaison listes MS et MS/

MS

512.65

912.87

1428.10

1171.35

745.98

1758.87

1002.65

1467.36

Recherche en banques de données

●Moteurs de recherche à partir de données en MS/MS● Mascot ou sequest

En cas d’échec

●Chercher par homologie de séquence● BLAST (Basic Local Alignment Search Tool)http://www.ncbi.nlm.nih.gov/BLAST/

En cas de nouvel échec

●Séquençage de novo !● Analyse approfondie des spectres MS/MS● Logiciels d’aide au séquençage de novo

MassSeq™ (Waters)RapiDeNovo™ (Bruker)

Importance du haut débit…

●Automatisations de toutes les étapes de l’analyse

Spot Picker (automated 2D gel imaging, spot detection and selection from 2D gels into 96 micro well plates).

gel spot digestion and processing

Q-Trap (Applied)

Q-TOF (Waters)

TOF-TOF (Bruker)

Les modifications post-traductionnelles

● Définition : après la traduction d’un ARN messager en protéine, celle-ci subit une maturation au cours de laquelle elle peut être associée à d’autres protéines ou diverses molécules.

● Les plus fréquentes● Ponts S-S● Glycosylations● Phosphorylations

● Et bien d’autres encore…

Fonctions

Stabilité protéique, protection N-terminaleRégulation des interactions protéine-DNA (histones)

Régulation de l’expression des gènes

Ancre Glycosylphosphatidylinositol (GPI). Ancrage aux enzymes et récepteurs membanaires….

Régulation des interactions protéines/protéines -/ligandsModifications chimique artéfactuelle

Stabilité protéique, blocage de l’extrémité N-terminale

Signal de dégradation

Nature des MPT

Acétylation

Méthylation

« Ancre » GPI 

Déamidation

Acide Pyroglutamique

Ubiquitine

∆ Masse (Da)

+42

+14

> 1000

+1

-17

> 1000

Stabilité

Réversible, activation/inactivation d’activités enzymatiquesModulation des interactions moléculairesSignalisation

Phosphorylation pTyr pSer, pThr

 +80+80

 ++++/++

+++

+++

Localisation cellulaire, signalisation,Ancrage membranaireInteractions protéines/protéines

Acylation, acides gras farnésyle myristoyle palmitoyle…etc

 +204+210+238

 +++++++/++

Excrétion des protéinesReconnaissance cellulaire/signalisationO-GlcNAc, réversible, régulation fonctionnelle

Glycosylation N-glycosylation O-glycosylation

 > 800

203, > 800

 +/+++/++

++

Stabilité des protéines. Interactions protéines-ligandsHydroxyproline +16 +++

Modulation Interactions protéine/protéine, récepteur/ligandSulfatation (sTyr) +80 +

Stabilité protéique, crosslink intra et inter moléculairePont Disulfure -2 ++

+++

+++

+/++

Nitratration des Tyrosines +45 +/++ Oxydation / processus inflammatoire

Les glycosylations

●Glycosylation : attachement covalent de glycannes (sucres) à une protéine (80% des protéines sont glycosylées)

●Différents types de liaison sucre-protéine● N-glycosylation (Asn : site consensus Asp-Xxx-Ser/Thr)● C-glycosylation (Trp : site consensus Trp-Xxx-Xxx-Trp)● O-glycosylation (Ser/Thr/Tyr)

●Rôle de la glycosylation● Intramoléculaire : repliement, solubilité…● Intermoléculaire : antigénique, immunogène, adhésion

cellulaire

Les glycosylations

●Structure des glycannes

●Localisation des sites de glycosylation

glycoprotéine

PNGase F

glycannes

RMN

Exoglycosi-dases + MS

séquenceconfigurationmasse moléculaire

glycoprotéine

trypsine LC/MS

glycopeptides

Nature et site de la glycosylation(intérêt de l’ECD)Exoglycosi-

dases

Les phosphorylations

●Phosphorylation : ajout d’une fonction phosphate● 100 000 sites potentiels de phosphorylation dans le

protéome humain (2 000 connus)● pSer : pThr : pTyr ~ 1800 : 200 : 1

●De nombreux processus cellulaires sont régulés par une phosphorylation

● Croissance cellulaire● Différenciation

Les phosphorylations

● Difficultés pour l’analyse des protéines phosphorylées● Faible taux de phosphorylation● Faible ionisation des peptides phosphorylés (apporte une

charge négative + caractère hydrophile)

Caractérisation par MSApproche top-down sur protéine entière

Après digestion enzymatique : recherche de peptides phosphorylés (perte de H3PO4, formation de m/z 79))

Localisation du site de phosphorylation par MS/MS ou ECD

Enrichissement en peptides phosphorylés IMAC (Immobilized Metal Affinity Chromatography)

La quantification● Approche ICAT (Isotope Coded Affinity Tag)

● Marquage de deux états cellulaires différents par un réactif lourd et un réactif léger

La quantification● Approche ITRAQ

La quantification●Approche ITRAQ

La quantification●Approche ITRAQ

Plan de l'exposé

Causes de l'essor de la spectrométrie de masse en biologie

Protéomique et techniques associées

Méthodes d'analyse structurale

Autres molécules ?

Techniques to study non-covalent interactions in proteins

native PAGE

Circular dichroism

IR spectroscopy

Fluorescence spectroscopy

Size exclusion chromatography

Small angle X-ray scattering

X-ray crystallography

NMR spectroscopy

Electron microscopy

Yeast two hybrid system

Differential scanning calorimetry

Capillary electrophoresis

Isothermal titration calorimetry

Surface plasmon resonance

Equilibrium dialysis

Mass Mass spectrometryspectrometry

mass precision

sensitivity speed

...

stoichiometry protein structure

MS strategies for studying non-covalent interactions

+

solution gas phase

bottom-up

native MS

chemical modification

MS/MS

top-down

Noncovalent complexes: from solution to the gas phase

Apollo ESI source

1 m

bar

0.1

mba

r

10-3 m

bar

2x10

-6 m

bar

ICR cell

CapExit heated glass capillaryhexapole

ESIESI

++

eq

eqeq

[PL][L][P]

Kdiss = ∑∑

+

+

==n (P)

n (PL)

nI[

]nI[

[P][PL]

Rn

n

]/

/

eq

eq

W. Wang, E. N. Kitova, J. S. Klassen, Meth. Enzymol. 362 (2003) 376-397.

[ ] [ ]R

R1RPL

[PL][L][P]

K 00diss

+⋅−==

eq

eqeq

On ne peut pas déterminer On ne peut pas déterminer les concentrations avec la les concentrations avec la spectrométrie de masse… spectrométrie de masse…

PLPL PP ++ LL

Calcul des constantes de dissociation

H/D exchange: basics

CO N

HHC

CH2

C ONH 2

CONHC

H

CH 2

C OOH

CON

HHC

CH 2

OH

CON

HHC

CH 2

SH

CON

HHC

(CH 2)4

NH 2

fast exchange

no exchange

exchange rate compatible with MS observation

HH =O H=O H

H/D exchange: strategy

H/D exchange H/D exchange

proteolysis proteolysis

massspectrometry

massspectrometry

m/zm/zm/zm/z

association

dissociation

H/D exchange: kinetics

621 622 623 624 625 m/z

0 9.3

% Dt / min

5 19.2

15 35.8

60 53.1

90 57.8

120 61.2

Protein

LysNH2NH2

Lys

Bis(Sulfosuccinimidyl)suberate,BS3, spacer arm length = 11.4 Å

O

N

O

OO

O

O

O NO

SO3Na

NaO3S

Bis(Sulfosuccinimidyl)suberate,BS3, spacer arm length = 11.4 Å

O

N

O

OO

O

O

O NO

SO3Na

NaO3S

Reaction principleReaction principle

O

O

NH

NH

CrossCross--Linked ProteinLinked Protein

O

O

NH

NH

CrossCross--Linked ProteinLinked Protein

Cross-linking is the process of joining two or more Cross-linking is the process of joining two or more molecules by a covalent bondmolecules by a covalent bond

Cross-linking

Cross-Cross-linkerlinker

homobifunctionalhomobifunctional

heterobifunctionalheterobifunctional

trifunctionaltrifunctional

zero-lengthzero-length

Cross-linker design principle

Protein NH2

R

Protein

O

O N

O

O

pH > 7

R

NH

O CH3

pH 8-9

ProteinHN

HN

NH

R

O

R

NHS ester

imidoester

Amine-reactive cross-linkers

Protein SH

6,5 < pH < 7,5

pH > 7

N R

O

O

N R

O

O

Protein S

R

I

pH > 7,5Protein S R

NSSR Protein S S R

pyridyl disulfide

active halogen

maleimide

Sulfhydryl-reactive cross-linkers

N C NR1 R2 + Protein1

O

OH

Protein1

O

O

C N R2HNR1

Protein2 NH2+Protein1

O

HN Protein2

+NH

O

HNR1 R2

Zero-length cross-linkers

Protein NH2+

R

N

+NN-

UV light

R

N:

NR

HN Protein

Photoreactive cross-linkers

Pierce Biotechnology, Inc., http://www.piercenet.com/

Crosslinker chemistry

test system: bovine basic fibroblast growth factor (FGF)-2test system: bovine basic fibroblast growth factor (FGF)-2

18 cross-linked peptides identified18 cross-linked peptides identified

15 cross-linked peptides yielded distance constraints15 cross-linked peptides yielded distance constraints

Fold family of FGF-2 correctly identifiedFold family of FGF-2 correctly identified

Young et al., Proc. Natl. Acac. Sci. 97(11) (2000) 5802-5806.

Protein fold analysis

isolationisolation

Cross-linkingCross-linking

isolationisolation

Protein complex analysis

Endoplasmatic reticulum chaperoneEndoplasmatic reticulum chaperonecalreticulin (CRT)calreticulin (CRT)

interactioninteraction

interleukin-12 interleukin-12 αα chain chain

Alloza et al., Anal. Biochem. 324 (2004) 137-142.

Protein complex analysis

α α

α

ββ

β

test system: test system: Helicobacter pyloriHelicobacter pylori urease (( urease ((αβαβ))33))44 dodecamers dodecamers

Detection of cross-linked peptidesDetection of cross-linked peptides

cross-linking between cross-linking between α α and and ββ subunit which is in accordance subunit which is in accordance with the dodecameric urease structurewith the dodecameric urease structure

Carlsohn et al., Int. J. Mass Spectrom. 234 (2004) 137-144.

Higher order structure of protein complexes

Plan de l'exposé

Causes de l'essor de la spectrométrie de masse en biologie

Protéomique et techniques associées

Méthodes d'analyse structurale

ADN, sucres et autres molécules

ADN, ARN

Mesures de masses possibles. Utilisé au début des années 2000 pour la détermination de SNP (single nucleotide polymorphism).

Séquençage en phase gazeuse possible, mais limité.

En compétition avec d'autres techniques (Hybridation sur puces à ADN, RT-PCR) qui sont très sensibles et très précises.

Pour les aspects structuraux : très similaire aux protéines.

Oligosaccharides

Domaine qui aurait mérité un exposé en lui-même.

Plus complexe que celui des protéines :− Pas de base de donnée génomique sur laquelle

s'appuyer.− Enchaînements branchés possibles.− Hétérogénéité des assemblages.− Modes de fragmentations plus nombreux

Métabolome

J.L. Mergny, mardi matin

Métabolome

J.L. Mergny, mardi matin

Multitude de composés de faibles masses moléculaires.

Pour partie peu indicatifs de l'état d'une cellule, sauf en cas de problèmes de désordre enzymatique.

Certains sont très indicateurs de l'état d'une cellule : utilisables comme marqueurs.

Nouvelle approche globale de recherche : « métabolomique »

Conclusion

Spectrométrie de masse apporte des gains importants à l'étude de composés biologiques :

− Sensibilité, rapidité d'analyse, précision− Versatilité

Apports structuraux : moins résolutive que d'autres techniques (RMN, cristallographie R-X), mais analyse directement en solution diluée possible, voire « in vivo » avec préparation de l'échantillon après coup.

Traite que de la moitié (solution) du problème. Voir Valérie demain pour l'approche en phase gaz.

Remerciements

Julia Chamot-Rooke Thorsten Daubenfeld