Module BioAnalyse Les Protéines ¾ -...
Transcript of Module BioAnalyse Les Protéines ¾ -...
Module BioAnalyse
Les Protéines
Cécile ALBENNE
Maître de conférences en biochimie
Equipe Protéines pariétales et développement (E. Jamet)
Objectifs de la journée
Objectifs et plan du cours
Rappel des fondamentaux sur les protéines
Présentation des méthodes d’étude structurale des protéines
• Relations structure/fonction
• Analyse protéomique
Mise en application directe sous forme de TD
Organisation de la journéeMatinée : Relations structure / fonction
1h30 de Cours : Principes et méthodes2h de TD : Analyse de données structurales à l’aide de logiciels adaptés
Après-midi : Analyse protéomique1h30 de Cours : Stratégies et outils2h de TD : Analyse de données de masse à l’aide de logiciels adaptés
1ère partie
Les protéines : relations structure / fonction
Plan du cours
Plan
I- La structure des protéines
II- Bio-cristallographie et RMN
III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire
exemple : l’amylosaccharase de Neisseria polysaccharea
TD : manipulation de DS Visualizer (Accelrys)
Structure primaire : enchaînement des acides aminés
I- Structure des protéines
Distinction : nature des chaînes latérales
Les chaînes non polaires.Ala (A), Val (V), Leu (L), Ile (I), Met (M), Phe (F), Trp (W), Pro (P)
Les chaînes polaires non ioniquesSer (S), Thr (T), Cys (C), Tyr (Y), Asn (N), Gln (Q)
Les chaînes polaires ioniquesanioniques : Asp (D), Glu (E) cationiques : His (H), Lys (K), Arg (R)
Rôle clé pour la structure et la réactivité
Structure primaire : enchaînement des acides aminés
I- Structure des protéines
αi
1,51Å1,45Å1,32Å
1,24Åhydrogène
oxygène
carbone
azote
ω
αi+1
Alignement de structures primaires ex: α-amylases
I- Structure des protéines
AS 126-GLTYLHLM-P-134 182-DFIFNH-187 254-QWDLN-258TAK 56-GFTAIWIT-P-64 117-DVVANH-122 155-YEDQ-158 173-LPDLD-177 AMY 36-GFGGVQVS-P-44 96-DAVINH-101 150-SYND-153 165-LLDLA-169 PUL 210-GVTHVELL-P-218 281-DVVYNH-286 308-AYGN-311 319-GNDIA-323 NPU 188-GINGIYLT-P-196 241-DAVFNH-246 284-NYDT-287 294-MPKLN-298CGT 70-GVTALWISQP-79 135-DFAPNH-140 185-SLEN-188 197-LADFN-201 GDE 137-GYNMIHFT-P-145 198-DVVYNH-203 248-KYKE-251 451-LRNFA-455 DSRS 958-GVTSFQLA-P-966 1023-DWVPDQ-1028 509-ANDVD-513 GTFB 862-GVTDFEMA-P-870 927-DWVPDQ-932 409-ANDVD-413GTFI 866-GITDFEMA-P-874 931-DWVPDQ-936 411-ANDVD-415GTFS 849-GITQFEMA-P-857 914-DLVPNQ-919 495-ANDVD-499
AS 282-ILRMDAVAF-290 328-EAIV-332 388-YVR--SHD-393 480-GLPLIYLGD-488TAK 202-GLRIDTVKH-210 230-EVLD-233 292-FVE--NHD-297 323-GIPIIYAGQ-331AMY 193-GFRLDASKH-201 233-EVID-236 295-FVD--NHD-300 334-GFTRVMSSY-342PUL 348-GFRFDLMGI-356 381-EGWD-384 464-YVE--SHD-469 405-GIPFLHSGQ-513NPU 323-GWRLDVANE-331 356-EVWH-359 418-LLG--SHD-423 450-GTPCIYYGD-458CGT 225-GIRVDAVKH-233 257-EWFL-260 323-FID--NHD-328 354-GVPAIYYGT-362GDE 505-GVRLDNCHS-513 538-ELFT-541 604-FMD-ITHD-610 642-GYDELVPHQ-650
DSRS 547-GIRVDAVDN-555 590-EDWS-593 657-FVR--AHD-662 727-TVPRVYYGD-735GTFB 447-SIRVDAVDN-455 489-EAWS-492 557-FIR--AHD-562 627-SVPRVYYGD-635GTFI 449-SIRVDAVDN-457 491-EAWS-494 559-FAR--AHD-564 629-SIPRVYYGD-637GTFS 433-GVRVDAVDN-441 475-EAWS-478 542-FIR--AHD-547 614-TVTRVYYGD-622
EEEEEEE
EEEE
DDDDDDD
DDDD
DDDDDDD
DDDD
HHHHHHHQQQQ
FHHIEHS
NNNN
HHHHHHH
HHHH
Séquences
signatures
Alignement de structures primaires : logiciels adaptés
I- Structure des protéines
Fasta Basic local alignmenthttp://www.dkfz-heidelberg.de/tbi/bioinfo/DBSearchI/FASTA/index.html
BLAST Basic Local Alignment Search toolhttp://www.ncbi.nlm.nih.gov/BLAST
BEAUTY:BLAST Alignement Blast amélioré informant sur les domaines/familles/régions conservéeshttp://searchlauncher.bcm.tmc.edu/seq-search/protein-search.html
CLUSTALW Alignement de plusieurs séquenceshttp://www.ebi.ac.uk/clustalw/
EXPASY Proteomics toolshttp://www.expasy.ch/tools
MULTALINhttp://www.toulouse.inra.fr/multalin.html
PFAMhttp://www.sanger.ac.uk/software/Pfam
Séquence logo: logiciel delilahttp://www.lecb.ncifcrf.gov/~toms/delila.html
Alignement de structures primaires : limites
I- Structure des protéines
si la protéine présente très peu d’homologie avec les protéines accessibles par les banques de données
pas d’informations structurales ou fonctionnelles
une ressemblance de structure ne signifie pas une ressemblance de séquenceEx: famille Glucoside Hydrolase : même organisation structurale peut être obtenue à partir de séquences très différentes entre elles (homologie<20%)
une même fonction ne correspond pas toujours à une forte homologie de séquence (cas des β-glucosidases)
Nécessité de disposer de la structure 3D !!
I- Structure des protéines
Arrangement structural : forces non-covalentes motrices
Forces d’interaction non-covalentes cruciales
- pour diriger le repliement spontané des protéines
- pour la reconnaissance mutuelle de surfaces moléculaires complémentaires
Forces en question :
- Interactions de van der Waals (<1 kcal/mol, dispersion+répulsion électronique)
- Interactions électrostatiques (paire d’ions, ex: pont salin, 1-6 kcal/mol)
- Liaison hydrogène (2-10 Kcal/mole)
- Interactions entre aromatiques (stacking) (1-2 kcalmol)
I- Structure des protéines
Structure secondaire
Hélice α
Brin β
3.6 AA / tour d’hélice
0.54 nm / tour d’hélice
0.35 nm / résidu
I- Structure des protéines
Structure tertiaire
Structure définie dans l’espace
- éléments de structure secondaire
- connection par des boucles
- parfois présence de domaines capables de se replier seuls
Existence de différents modes de repliements:
(α/α)6 β-jelly roll (β/α)8 β-propeller
Dogme : les structures des protéines sont mieux conservées que leurs séquences
I- Structure des protéines
Structure tertiaire : propriétés des boucles
généralement disposées à la surface des protéines, nombreux contacts avec le solvant
présence de résidus ioniques
flexibilité importante pour ajustement induit et adaptation de la protéine autour de la molécule étrangère
mises à contribution pour modeler le site actif
impliquées dans la spécificité à partir d’une charpente commune, évolution vers de nouvelles fonctions
évolution plus rapide que les éléments structuraux
I- Structure des protéines
Structure tertiaire : généralités
- Majorité des groupements apolaires forment des noyaux hydrophobes à l’intérieur de la protéine
- 90 % groupements polaires à l’intérieur de la structure impliqués dans des liaisons hydrogène
- Groupements chargés à la surface augmentent la solubilité
Protéines = assemblage très dense
forces non covalentes efficacement utilisées
interactions hydrophobes essentielles pour la stabilité
I- Structure des protéines
Modifications post-traductionnelles des protéines
- Modification covalente des protéines qui change la structure et donc les propriétés des protéines
- Différentes MPT opérées par des enzymes dédiées :
• clivage protéolytique
• addition de groupements
- Incidences sur l’activité, la stabilité, le repliement, les interactions avec d’autres protéines, …
I- Structure des protéines
Modifications post-traductionnelles des protéines
I- Structure des protéines
La glycosylation des protéines
Modification post-traductionnelle la plus répandue : > 50 % des protéines eucaryotes
Implication dans les processus de reconnaissance moléculaire, signalisation, stabilisation, repliement et structure
NN--GlycosylGlycosyl OO--GlycosylGlycosyl
N- et O-glycosylationSpécifique plantes !!
Motif consensus : N-X-T/S
I- Structure des protéines
La glycosylation des protéines
N-glycosylation sur une résidu Asn O-glycosylation sur une résidu Ser
I- Structure des protéines
La N-glycosylation des protéines
glucosidasesglucosidases mannosidasesmannosidases
GLYCOSYL GLYCOSYL TRANSFERASETRANSFERASE
GnT1 GnT1 NN--AcetylglucosaminylAcetylglucosaminyl
transferasestransferases
FucosyltransferasesFucosyltransferases
XylosyltransferasesXylosyltransferases
I- Structure des protéines
La O-glycosylation des protéines végétales : HRGP
II- Méthodes de résolution
Cristallographie et diffraction des rayons X
1ères structures “hémoglobine” (M. Perutz) et « myoglobine » (J. C. Kendrew ) (1958)
Technique la plus utilisée
Quantités nécessaires : dizaine(s) de mg de protéine pure en solution
Nombreux programmes de génomique structurale lancés en Europe et dans le monde
Objectif: acquérir le plus rapidement possible la structure de nouvelles protéines
Stratégie: à partir du séquençage de différents génomes, clonage du plus grand nombre possible de gènes/ expression/ purification/ cristallisation/ Diffraction des rayons X/ Structure 3D
II- Cristallographie
Démarche
A partir d’une préparation de protéine purifiée :
1- Conditionnement de l’échantillon
2- Cristallisation
3- Caractérisation des cristaux
4- Enregistrement des données de diffraction
5- Phasage
6- Construction d’un modèle initial
7- Affinement
8- Analyse de la structure 3D appel à la biologie moléculaire et la biochimie
II- Cristallographie
Cristallisation
Cristal = organisation des molécules en un réseau ordonné
Méthode: mise en présence de la solution protéique avec une solution contenant un agent précipitant (Sels, PEG, composés organiques volatils,....)
diffusion de vapeursévolution vers un équilibre
thermodynamique via une phase de sur-saturation
nucléation puis croissance des cristaux par réduction du niveau de sur-saturation pour favoriser la croissance de plus gros cristaux et obtenir une structure la plus ordonnée possible.
II- Cristallographie
Cristallographie et diffraction des rayons X : cristaux
Propriétés des cristaux :
arrangements réguliers des molécules, atomes et ions
formes et couleurs variables
généralement anisotropes (propriétés physiques variables selon la direction considérée)
arrangement visualisable par microscopie électronique mais résolution insuffisante pour déterminer la structure à l’échelle atomique
diffraction des rayons X
II- Cristallographie
Obtention des clichés de diffraction
Rayonnement synchrotron :résultant du «freinage» d’électrons de très haute énergie circulant dans un anneau de plusieurs dizaines de mètres de diamètresources extrêmement brillantes et très bien résolues en longueur d’onde par divers systèmes de filtres et de monochromateurs.
Cliché de diffraction
Résolution d’autant plus que les tâches de diffraction sont éloignées du centre
II- Cristallographie
Analyse des clichés de diffraction
Caractéristiques des faisceaux diffractés
- amplitudes et phases déterminées par la position des atomes dans la maille
- amplitude mesurable (intensité)
- phase inconnue mais donnée essentielle phasage = étape clé (calcul)
II- Cristallographie
Carte de densité électronique
Amplitudes mesurées + phases calculées cartes de densité électronique
Structure 3D
Affinement
II- RMN
Résonance Magnétique Nucléaire
- RMN bi ou tri-dimensionnelle
<80 aa RMN 1H
80-120 aa 1H, 15N
120-200 aa 1H, 15N, 13C
200-300 aa 1H, 15N, 2H, 13C
- alternative pour la résolution de protéines de petite taille
- limitée aux protéines de petites tailles (20 000 Da) en solution
- aspect dynamique : intérêt vis-à-vis de la cristallographie
- quantité nécessaire 5 à 50 mg en solution
II- Banques de données
http://www.rcsb.org/pdb
II- Banques de données
http://www.rcsb.org/pdb
Structures 3D expérimentales
16/09/2008: 53 103 structures disponibles
Fin 2004: 25 000 structures
Fin 2000: 13 500 structures
Fin 1995: 4000
Fin 1990: < 50
II- Banques de données
http://www.rcsb.org/pdb
Structures 3D expérimentales
16/09/2008: 53 103 structures disponibles
45 319 / cristallographie
7 489 / RMN
195 / microscopie électronique
II- Banques de données
par année
total
II- Banques de données
Nombre de structures de protéines extraites de leur
organisme d’expression naturel
II- Banques de données
42 structures
51 structures
34 structures
25 structures
25 structures
Nombre de structures de protéines extraites de leur
organisme d’expression naturel
II- Banques de données
47 structures
45 structures
38 structures
Nombre de structures de protéines exprimées par voie
hétérologue
AU TOTAL : < 600 structures de protéines végétales !!
II- Logiciels utiles
De la visualisation seule .....
• DS Visualizer
http://www.accelrys.com/products/downloads/ds_visualizer/
• Rastop
http://www.inrp.fr/Acces/biotic/rastop/accueil.htm
• Rasmol
www.umass.edu/microbio/rasmol/
• PyMol
http://pymol.sourceforge.net/
... à la modélisation moléculaire
• SPDBV
www.expasy.ch/spdbv/
• Insight
http://www.accelrys.com/about/msi.html
Application TD
- affinement des structures expérimentales : calcul des positions de chaînes latérales des acides aminés (critères stéréochimiques)
- évaluation de la faisabilité de mutations ponctuelles
- prédiction de structures : construction de modèles à partir d’une structure de protéine connue de séquence analogue
- étude des interactions protéine-ligand ou leur modélisation (docking)
- étude de la trajectoire de substrats vers le site actif
- évaluation de la flexibilité des boucles
- design de molécules, d’inhibiteurs
Structure/FonctionII- Modélisation moléculaire
Applications
III- L’ingeniérie des protéines
Comprendre - le mode d’action (catalyse, interaction, ...)
- la spécificité des enzymes
Exploiter ces connaissances :
- pour modifier la fonction d’une protéine
ex: empêcher ou améliorer une interaction avec un ligand, ...
- pour améliorer les enzymes
ex: amélioration de l’efficacité, de la stabilité, …
- pour créer de nouveaux catalyseurs
ex: modification de la spécificité, …
Intérêt et applications
Relations structure-fonction
Ingénierie
Deux approches: du rationnel au combinatoire
Ingénierie rationnelle- analyse de données structurales (structure primaire et tertiaire)
identification de résidus cibles- construction de mutants par mutagénèse dirigée
modification du gène et donc de la séquence en acides aminés- caractérisation de l’activité des mutants
rôle des acides aminés ciblés / design rationnel
Ingénierie combinatoire- mutagénèse aléatoire et/ou recombinaison in vitro du gène d’intérêt
construction de larges banques de variants (106 à 1013 variants)- criblage des banques pour isoler les variants ayant l’activité recherchée
criblage in vitro : miniaturisation / automatisation des protocoles- caractérisation de l’activité des mutants
identification de résidus clés / optimisation d’enzymes
Prêts requis
(structures Iaire / IIIaire)
Criblage limitant
III- L’ingeniérie des protéines
Mutagénèse dirigée : démarche
Analyse des alignements de séquence ou de la structure 3D d’une protéine
identification des positions cibles
modélisation moléculaire
Mutagénèse dirigée des résidus identifiés
construction, expression et purification des variants sous forme recombinante ou in vivo
pGSTAS6880 bp
AS
Caractérisation de l’activité des mutants (in vitro ou in vivo)
test biochimique in vitro ou recherche de phénotypes
démonstration du rôle de ces résidus
III- L’ingeniérie des protéines
Mutagénèse aléatoire
Fragmentation
Séquences recombinées
Reassemblage par PCR sans amorce
Gène parent
Mutagénèse aléatoire
Génération de libraries de50 000 variants
Transformation d’E. coli
III- L’ingeniérie des protéines
Criblage in vitro de banques de variants
Croissance et expressionen milieu liquide
Lyse
Réaction enzymatique
Détection colorimétrique des
clones positifs
Sélection
des clones actifsMicroplaques
96 puits
Test 1 Test 2
Repiquage de colonies
III- L’ingeniérie des protéines
Criblage des banques de variants : automatisation
Automate de repiquage sélectif de colonies bactériennes et de levures permettant l’inoculation de mini-cultures en format micro-plaques
QpixII, Genetix
Module d’agitation de micro-plaques pour la croissance cellulaire et l’expression génique en milieu liquide
Kühner
Automate de transferts de liquides en conditions stériles
Biomek 2000, Beckman
III- L’ingeniérie des protéines
Criblage des banques de variants : automatisation
III- L’ingeniérie des protéines
Station intégrée (Genesis RSP200, TECAN) de transferts de liquides et de micro-plaques comprenant :
- un module de pipettage
- un bras robotique
- des incubateurs
- un spectrophotomètre
Elle permet le criblage phénotypique des banques de variants.
Cadence : 10 000 clones / semaine
Exemple de l’amylosaccharase de Neisseria polysaccharea
De l’ingénierie rationnelle à l’approche combinatoire