Module BioAnalyse Les Protéines ¾ -...

12
Module BioAnalyse Les Protéines Cécile ALBENNE [email protected] Maître de conférences en biochimie Equipe Protéines pariétales et développement (E. Jamet) Objectifs de la journée Objectifs et plan du cours Rappel des fondamentaux sur les protéines Présentation des méthodes d’étude structurale des protéines Relations structure/fonction Analyse protéomique Mise en application directe sous forme de TD Organisation de la journée Matinée : Relations structure / fonction 1h30 de Cours : Principes et méthodes 2h de TD : Analyse de données structurales à l’aide de logiciels adaptés Après-midi : Analyse protéomique 1h30 de Cours : Stratégies et outils 2h de TD : Analyse de données de masse à l’aide de logiciels adaptés 1 ère partie Les protéines : relations structure / fonction Plan du cours Plan I- La structure des protéines II- Bio-cristallographie et RMN III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire exemple : l’amylosaccharase de Neisseria polysaccharea TD : manipulation de DS Visualizer (Accelrys)

Transcript of Module BioAnalyse Les Protéines ¾ -...

Page 1: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

Module BioAnalyse

Les Protéines

Cécile ALBENNE

[email protected]

Maître de conférences en biochimie

Equipe Protéines pariétales et développement (E. Jamet)

Objectifs de la journée

Objectifs et plan du cours

Rappel des fondamentaux sur les protéines

Présentation des méthodes d’étude structurale des protéines

• Relations structure/fonction

• Analyse protéomique

Mise en application directe sous forme de TD

Organisation de la journéeMatinée : Relations structure / fonction

1h30 de Cours : Principes et méthodes2h de TD : Analyse de données structurales à l’aide de logiciels adaptés

Après-midi : Analyse protéomique1h30 de Cours : Stratégies et outils2h de TD : Analyse de données de masse à l’aide de logiciels adaptés

1ère partie

Les protéines : relations structure / fonction

Plan du cours

Plan

I- La structure des protéines

II- Bio-cristallographie et RMN

III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire

exemple : l’amylosaccharase de Neisseria polysaccharea

TD : manipulation de DS Visualizer (Accelrys)

Page 2: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

Structure primaire : enchaînement des acides aminés

I- Structure des protéines

Distinction : nature des chaînes latérales

Les chaînes non polaires.Ala (A), Val (V), Leu (L), Ile (I), Met (M), Phe (F), Trp (W), Pro (P)

Les chaînes polaires non ioniquesSer (S), Thr (T), Cys (C), Tyr (Y), Asn (N), Gln (Q)

Les chaînes polaires ioniquesanioniques : Asp (D), Glu (E) cationiques : His (H), Lys (K), Arg (R)

Rôle clé pour la structure et la réactivité

Structure primaire : enchaînement des acides aminés

I- Structure des protéines

αi

1,51Å1,45Å1,32Å

1,24Åhydrogène

oxygène

carbone

azote

ω

αi+1

Alignement de structures primaires ex: α-amylases

I- Structure des protéines

AS 126-GLTYLHLM-P-134 182-DFIFNH-187 254-QWDLN-258TAK 56-GFTAIWIT-P-64 117-DVVANH-122 155-YEDQ-158 173-LPDLD-177 AMY 36-GFGGVQVS-P-44 96-DAVINH-101 150-SYND-153 165-LLDLA-169 PUL 210-GVTHVELL-P-218 281-DVVYNH-286 308-AYGN-311 319-GNDIA-323 NPU 188-GINGIYLT-P-196 241-DAVFNH-246 284-NYDT-287 294-MPKLN-298CGT 70-GVTALWISQP-79 135-DFAPNH-140 185-SLEN-188 197-LADFN-201 GDE 137-GYNMIHFT-P-145 198-DVVYNH-203 248-KYKE-251 451-LRNFA-455 DSRS 958-GVTSFQLA-P-966 1023-DWVPDQ-1028 509-ANDVD-513 GTFB 862-GVTDFEMA-P-870 927-DWVPDQ-932 409-ANDVD-413GTFI 866-GITDFEMA-P-874 931-DWVPDQ-936 411-ANDVD-415GTFS 849-GITQFEMA-P-857 914-DLVPNQ-919 495-ANDVD-499

AS 282-ILRMDAVAF-290 328-EAIV-332 388-YVR--SHD-393 480-GLPLIYLGD-488TAK 202-GLRIDTVKH-210 230-EVLD-233 292-FVE--NHD-297 323-GIPIIYAGQ-331AMY 193-GFRLDASKH-201 233-EVID-236 295-FVD--NHD-300 334-GFTRVMSSY-342PUL 348-GFRFDLMGI-356 381-EGWD-384 464-YVE--SHD-469 405-GIPFLHSGQ-513NPU 323-GWRLDVANE-331 356-EVWH-359 418-LLG--SHD-423 450-GTPCIYYGD-458CGT 225-GIRVDAVKH-233 257-EWFL-260 323-FID--NHD-328 354-GVPAIYYGT-362GDE 505-GVRLDNCHS-513 538-ELFT-541 604-FMD-ITHD-610 642-GYDELVPHQ-650

DSRS 547-GIRVDAVDN-555 590-EDWS-593 657-FVR--AHD-662 727-TVPRVYYGD-735GTFB 447-SIRVDAVDN-455 489-EAWS-492 557-FIR--AHD-562 627-SVPRVYYGD-635GTFI 449-SIRVDAVDN-457 491-EAWS-494 559-FAR--AHD-564 629-SIPRVYYGD-637GTFS 433-GVRVDAVDN-441 475-EAWS-478 542-FIR--AHD-547 614-TVTRVYYGD-622

EEEEEEE

EEEE

DDDDDDD

DDDD

DDDDDDD

DDDD

HHHHHHHQQQQ

FHHIEHS

NNNN

HHHHHHH

HHHH

Séquences

signatures

Alignement de structures primaires : logiciels adaptés

I- Structure des protéines

Fasta Basic local alignmenthttp://www.dkfz-heidelberg.de/tbi/bioinfo/DBSearchI/FASTA/index.html

BLAST Basic Local Alignment Search toolhttp://www.ncbi.nlm.nih.gov/BLAST

BEAUTY:BLAST Alignement Blast amélioré informant sur les domaines/familles/régions conservéeshttp://searchlauncher.bcm.tmc.edu/seq-search/protein-search.html

CLUSTALW Alignement de plusieurs séquenceshttp://www.ebi.ac.uk/clustalw/

EXPASY Proteomics toolshttp://www.expasy.ch/tools

MULTALINhttp://www.toulouse.inra.fr/multalin.html

PFAMhttp://www.sanger.ac.uk/software/Pfam

Séquence logo: logiciel delilahttp://www.lecb.ncifcrf.gov/~toms/delila.html

Page 3: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

Alignement de structures primaires : limites

I- Structure des protéines

si la protéine présente très peu d’homologie avec les protéines accessibles par les banques de données

pas d’informations structurales ou fonctionnelles

une ressemblance de structure ne signifie pas une ressemblance de séquenceEx: famille Glucoside Hydrolase : même organisation structurale peut être obtenue à partir de séquences très différentes entre elles (homologie<20%)

une même fonction ne correspond pas toujours à une forte homologie de séquence (cas des β-glucosidases)

Nécessité de disposer de la structure 3D !!

I- Structure des protéines

Arrangement structural : forces non-covalentes motrices

Forces d’interaction non-covalentes cruciales

- pour diriger le repliement spontané des protéines

- pour la reconnaissance mutuelle de surfaces moléculaires complémentaires

Forces en question :

- Interactions de van der Waals (<1 kcal/mol, dispersion+répulsion électronique)

- Interactions électrostatiques (paire d’ions, ex: pont salin, 1-6 kcal/mol)

- Liaison hydrogène (2-10 Kcal/mole)

- Interactions entre aromatiques (stacking) (1-2 kcalmol)

I- Structure des protéines

Structure secondaire

Hélice α

Brin β

3.6 AA / tour d’hélice

0.54 nm / tour d’hélice

0.35 nm / résidu

I- Structure des protéines

Structure tertiaire

Structure définie dans l’espace

- éléments de structure secondaire

- connection par des boucles

- parfois présence de domaines capables de se replier seuls

Existence de différents modes de repliements:

(α/α)6 β-jelly roll (β/α)8 β-propeller

Dogme : les structures des protéines sont mieux conservées que leurs séquences

Page 4: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

I- Structure des protéines

Structure tertiaire : propriétés des boucles

généralement disposées à la surface des protéines, nombreux contacts avec le solvant

présence de résidus ioniques

flexibilité importante pour ajustement induit et adaptation de la protéine autour de la molécule étrangère

mises à contribution pour modeler le site actif

impliquées dans la spécificité à partir d’une charpente commune, évolution vers de nouvelles fonctions

évolution plus rapide que les éléments structuraux

I- Structure des protéines

Structure tertiaire : généralités

- Majorité des groupements apolaires forment des noyaux hydrophobes à l’intérieur de la protéine

- 90 % groupements polaires à l’intérieur de la structure impliqués dans des liaisons hydrogène

- Groupements chargés à la surface augmentent la solubilité

Protéines = assemblage très dense

forces non covalentes efficacement utilisées

interactions hydrophobes essentielles pour la stabilité

I- Structure des protéines

Modifications post-traductionnelles des protéines

- Modification covalente des protéines qui change la structure et donc les propriétés des protéines

- Différentes MPT opérées par des enzymes dédiées :

• clivage protéolytique

• addition de groupements

- Incidences sur l’activité, la stabilité, le repliement, les interactions avec d’autres protéines, …

I- Structure des protéines

Modifications post-traductionnelles des protéines

Page 5: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

I- Structure des protéines

La glycosylation des protéines

Modification post-traductionnelle la plus répandue : > 50 % des protéines eucaryotes

Implication dans les processus de reconnaissance moléculaire, signalisation, stabilisation, repliement et structure

NN--GlycosylGlycosyl OO--GlycosylGlycosyl

N- et O-glycosylationSpécifique plantes !!

Motif consensus : N-X-T/S

I- Structure des protéines

La glycosylation des protéines

N-glycosylation sur une résidu Asn O-glycosylation sur une résidu Ser

I- Structure des protéines

La N-glycosylation des protéines

glucosidasesglucosidases mannosidasesmannosidases

GLYCOSYL GLYCOSYL TRANSFERASETRANSFERASE

GnT1 GnT1 NN--AcetylglucosaminylAcetylglucosaminyl

transferasestransferases

FucosyltransferasesFucosyltransferases

XylosyltransferasesXylosyltransferases

I- Structure des protéines

La O-glycosylation des protéines végétales : HRGP

Page 6: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

II- Méthodes de résolution

Cristallographie et diffraction des rayons X

1ères structures “hémoglobine” (M. Perutz) et « myoglobine » (J. C. Kendrew ) (1958)

Technique la plus utilisée

Quantités nécessaires : dizaine(s) de mg de protéine pure en solution

Nombreux programmes de génomique structurale lancés en Europe et dans le monde

Objectif: acquérir le plus rapidement possible la structure de nouvelles protéines

Stratégie: à partir du séquençage de différents génomes, clonage du plus grand nombre possible de gènes/ expression/ purification/ cristallisation/ Diffraction des rayons X/ Structure 3D

II- Cristallographie

Démarche

A partir d’une préparation de protéine purifiée :

1- Conditionnement de l’échantillon

2- Cristallisation

3- Caractérisation des cristaux

4- Enregistrement des données de diffraction

5- Phasage

6- Construction d’un modèle initial

7- Affinement

8- Analyse de la structure 3D appel à la biologie moléculaire et la biochimie

II- Cristallographie

Cristallisation

Cristal = organisation des molécules en un réseau ordonné

Méthode: mise en présence de la solution protéique avec une solution contenant un agent précipitant (Sels, PEG, composés organiques volatils,....)

diffusion de vapeursévolution vers un équilibre

thermodynamique via une phase de sur-saturation

nucléation puis croissance des cristaux par réduction du niveau de sur-saturation pour favoriser la croissance de plus gros cristaux et obtenir une structure la plus ordonnée possible.

II- Cristallographie

Cristallographie et diffraction des rayons X : cristaux

Propriétés des cristaux :

arrangements réguliers des molécules, atomes et ions

formes et couleurs variables

généralement anisotropes (propriétés physiques variables selon la direction considérée)

arrangement visualisable par microscopie électronique mais résolution insuffisante pour déterminer la structure à l’échelle atomique

diffraction des rayons X

Page 7: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

II- Cristallographie

Obtention des clichés de diffraction

Rayonnement synchrotron :résultant du «freinage» d’électrons de très haute énergie circulant dans un anneau de plusieurs dizaines de mètres de diamètresources extrêmement brillantes et très bien résolues en longueur d’onde par divers systèmes de filtres et de monochromateurs.

Cliché de diffraction

Résolution d’autant plus que les tâches de diffraction sont éloignées du centre

II- Cristallographie

Analyse des clichés de diffraction

Caractéristiques des faisceaux diffractés

- amplitudes et phases déterminées par la position des atomes dans la maille

- amplitude mesurable (intensité)

- phase inconnue mais donnée essentielle phasage = étape clé (calcul)

II- Cristallographie

Carte de densité électronique

Amplitudes mesurées + phases calculées cartes de densité électronique

Structure 3D

Affinement

II- RMN

Résonance Magnétique Nucléaire

- RMN bi ou tri-dimensionnelle

<80 aa RMN 1H

80-120 aa 1H, 15N

120-200 aa 1H, 15N, 13C

200-300 aa 1H, 15N, 2H, 13C

- alternative pour la résolution de protéines de petite taille

- limitée aux protéines de petites tailles (20 000 Da) en solution

- aspect dynamique : intérêt vis-à-vis de la cristallographie

- quantité nécessaire 5 à 50 mg en solution

Page 8: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

II- Banques de données

http://www.rcsb.org/pdb

II- Banques de données

http://www.rcsb.org/pdb

Structures 3D expérimentales

16/09/2008: 53 103 structures disponibles

Fin 2004: 25 000 structures

Fin 2000: 13 500 structures

Fin 1995: 4000

Fin 1990: < 50

II- Banques de données

http://www.rcsb.org/pdb

Structures 3D expérimentales

16/09/2008: 53 103 structures disponibles

45 319 / cristallographie

7 489 / RMN

195 / microscopie électronique

II- Banques de données

par année

total

Page 9: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

II- Banques de données

Nombre de structures de protéines extraites de leur

organisme d’expression naturel

II- Banques de données

42 structures

51 structures

34 structures

25 structures

25 structures

Nombre de structures de protéines extraites de leur

organisme d’expression naturel

II- Banques de données

47 structures

45 structures

38 structures

Nombre de structures de protéines exprimées par voie

hétérologue

AU TOTAL : < 600 structures de protéines végétales !!

II- Logiciels utiles

De la visualisation seule .....

• DS Visualizer

http://www.accelrys.com/products/downloads/ds_visualizer/

• Rastop

http://www.inrp.fr/Acces/biotic/rastop/accueil.htm

• Rasmol

www.umass.edu/microbio/rasmol/

• PyMol

http://pymol.sourceforge.net/

... à la modélisation moléculaire

• SPDBV

www.expasy.ch/spdbv/

• Insight

http://www.accelrys.com/about/msi.html

Application TD

Page 10: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

- affinement des structures expérimentales : calcul des positions de chaînes latérales des acides aminés (critères stéréochimiques)

- évaluation de la faisabilité de mutations ponctuelles

- prédiction de structures : construction de modèles à partir d’une structure de protéine connue de séquence analogue

- étude des interactions protéine-ligand ou leur modélisation (docking)

- étude de la trajectoire de substrats vers le site actif

- évaluation de la flexibilité des boucles

- design de molécules, d’inhibiteurs

Structure/FonctionII- Modélisation moléculaire

Applications

III- L’ingeniérie des protéines

Comprendre - le mode d’action (catalyse, interaction, ...)

- la spécificité des enzymes

Exploiter ces connaissances :

- pour modifier la fonction d’une protéine

ex: empêcher ou améliorer une interaction avec un ligand, ...

- pour améliorer les enzymes

ex: amélioration de l’efficacité, de la stabilité, …

- pour créer de nouveaux catalyseurs

ex: modification de la spécificité, …

Intérêt et applications

Relations structure-fonction

Ingénierie

Deux approches: du rationnel au combinatoire

Ingénierie rationnelle- analyse de données structurales (structure primaire et tertiaire)

identification de résidus cibles- construction de mutants par mutagénèse dirigée

modification du gène et donc de la séquence en acides aminés- caractérisation de l’activité des mutants

rôle des acides aminés ciblés / design rationnel

Ingénierie combinatoire- mutagénèse aléatoire et/ou recombinaison in vitro du gène d’intérêt

construction de larges banques de variants (106 à 1013 variants)- criblage des banques pour isoler les variants ayant l’activité recherchée

criblage in vitro : miniaturisation / automatisation des protocoles- caractérisation de l’activité des mutants

identification de résidus clés / optimisation d’enzymes

Prêts requis

(structures Iaire / IIIaire)

Criblage limitant

III- L’ingeniérie des protéines

Mutagénèse dirigée : démarche

Analyse des alignements de séquence ou de la structure 3D d’une protéine

identification des positions cibles

modélisation moléculaire

Mutagénèse dirigée des résidus identifiés

construction, expression et purification des variants sous forme recombinante ou in vivo

pGSTAS6880 bp

AS

Caractérisation de l’activité des mutants (in vitro ou in vivo)

test biochimique in vitro ou recherche de phénotypes

démonstration du rôle de ces résidus

III- L’ingeniérie des protéines

Page 11: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

Mutagénèse aléatoire

Fragmentation

Séquences recombinées

Reassemblage par PCR sans amorce

Gène parent

Mutagénèse aléatoire

Génération de libraries de50 000 variants

Transformation d’E. coli

III- L’ingeniérie des protéines

Criblage in vitro de banques de variants

Croissance et expressionen milieu liquide

Lyse

Réaction enzymatique

Détection colorimétrique des

clones positifs

Sélection

des clones actifsMicroplaques

96 puits

Test 1 Test 2

Repiquage de colonies

III- L’ingeniérie des protéines

Criblage des banques de variants : automatisation

Automate de repiquage sélectif de colonies bactériennes et de levures permettant l’inoculation de mini-cultures en format micro-plaques

QpixII, Genetix

Module d’agitation de micro-plaques pour la croissance cellulaire et l’expression génique en milieu liquide

Kühner

Automate de transferts de liquides en conditions stériles

Biomek 2000, Beckman

III- L’ingeniérie des protéines

Criblage des banques de variants : automatisation

III- L’ingeniérie des protéines

Station intégrée (Genesis RSP200, TECAN) de transferts de liquides et de micro-plaques comprenant :

- un module de pipettage

- un bras robotique

- des incubateurs

- un spectrophotomètre

Elle permet le criblage phénotypique des banques de variants.

Cadence : 10 000 clones / semaine

Page 12: Module BioAnalyse Les Protéines ¾ - genotoul-bioinfosnp.toulouse.inra.fr/~gaulin/doc/0809_albenne_CM1.pdf · III- Ingénierie enzymatique : mutagénèse dirigée et aléatoire Ö

Exemple de l’amylosaccharase de Neisseria polysaccharea

De l’ingénierie rationnelle à l’approche combinatoire