PROTÉOMIQUE STRUCTURALE DE … · Mise en contexte et biologie de Methanobacterium...

101
ISABELLE GIGNAC PROTÉOMIQUE STRUCTURALE DE METHANOBACTERIUM THERMOAUTOTROPHICUM; STRUCTURE ET FONCTION D’UNE PROTÉINE CLASSIFIÉE PRÉSERVÉE DANS LE GÉNOME Mémoire présenté à la Faculté des études supérieures de l'Université Laval dans le cadre du programme de maîtrise en biochimie pour l’obtention du grade de maître ès Sciences (M.Sc.) FACULTÉ DES SCIENCES ET DE GÉNIE UNIVERSITÉ LAVAL QUÉBEC AVRIL 2004 © Isabelle Gignac, 2004

Transcript of PROTÉOMIQUE STRUCTURALE DE … · Mise en contexte et biologie de Methanobacterium...

ISABELLE GIGNAC

PROTÉOMIQUE STRUCTURALE DE METHANOBACTERIUM

THERMOAUTOTROPHICUM; STRUCTURE ET FONCTION D’UNE PROTÉINE CLASSIFIÉE PRÉSERVÉE DANS LE GÉNOME

Mémoire présenté à la Faculté des études supérieures de l'Université Laval dans le cadre du programme de maîtrise en biochimie

pour l’obtention du grade de maître ès Sciences (M.Sc.)

FACULTÉ DES SCIENCES ET DE GÉNIE UNIVERSITÉ LAVAL

QUÉBEC

AVRIL 2004

© Isabelle Gignac, 2004

i

Résumé La fonction d’une protéine est ultimement déterminée par sa structure

tridimensionnelle. La compréhension complète de la fonction d’une protéine implique

donc la connaissance de sa structure. Le grand nombre de projet de séquençage de

génome résulte en plusieurs dizaines de milliers de séquences de protéines pour

lesquelles il n’existe aucune information fonctionnelle. La protéomique structurale

implique l’étude de la structure tridimensionnelle de toutes les protéines d’un protéome.

Comme la détermination de la structure d’une protéine est un processus laborieux, la

protéomique structurale est un des plus grands défis scientifiques du 21e siècle. Malgré

cela, plusieurs projets de protéomique structurale ont récemment débuté à travers le

monde.

Ce mémoire présente une étude qui s’inscrit dans le cadre d’un de ces projets à

grande échelle, la protéomique structurale de Methanobacterium thermoautotrophicum.

À l’aide de la résonance magnétique nucléaire, la structure tridimensionnelle de

MTH187, une protéine de Methanobacterium thermoautotrophicum, a été déterminée.

MTH187 est classifié comme ayant une séquence conservée, et sa fonction est inconnue.

La structure de MTH187 révèle que cette protéine de 111 acides aminés est composée de

six hélices α de 10 à 14 résidus. Par homologie structurale, il a été possible de classifier

MTH187 parmi une famille structurale de type « HEAT repeat ». Les protéines de cette

famille possèdent une fonction de reconnaissance protéines-protéines.

ii

Avant-Propos

Je tiens tout d’abord à remercier mon directeur de recherche, le Dr Stéphane Gagné

qui m’a accueilli dans son laboratoire et qui a eu confiance en moi tout au long de cette

maîtrise. Sa grande connaissance scientifique, sa présence et son dévouement m’ont

permis de franchir une étape des plus importante dans ma vie. Je le remercie également

pour sa franchise. Elle m’a permis de me connaître davantage. Je remercie mes collègues

de travail et amis, Pierre-Yves Savard, Jean-Baptiste Duvignaud, Leigh Willard, Katia

Lecours et Olivier Julien qui m’ont aidée et encouragée. Un grand merci en autre à

Olivier Julien, Etienne Noumen et Jonathan Pellicelli pour le travail supplémentaire

effectué sur mes résultats. Je tiens à remercier le laboratoire de Cheryl H. Arrowsmith de

l’Université de Toronto pour l’expression et la purification de la protéine. Également le

Centre National de RMN (NANUC) pour l’acquisition de certains spectres. Finalement,

un très gros merci à mon père et ma mère pour leurs amours, leurs aides et leurs

encouragements durant ces nombreuses années d’études. Vous m’avez permis de

persévérer dans ce que je rêvais de faire. Merci aussi à mon copain François pour son

soutien, son aide et sa compréhension dans les décisions prises depuis de nombreuses

années.

iii

Table des matières

CHAPITRE 1. INTRODUCTION...................................................................................... 1 1.1. Vue d’ensemble du mémoire ................................................................................... 1 1.2. Protéomique structurale ........................................................................................... 1 1.3. Cristallographie et RMN.......................................................................................... 2 1.4. Mise en contexte et biologie de Methanobacterium thermoautotrophicum ............ 3 1.5. Protéine MTH187 .................................................................................................... 5 1.6. Buts du projet de maîtrise ........................................................................................ 7

CHAPITRE 2. DÉTERMINATION DE LA STRUCTURE DES PROTÉINES PAR RÉSONANCE MAGNÉTIQUE NUCLÉAIRE ................................................................. 9

2.1. Niveaux de structure des protéines .......................................................................... 9 2.2. Principes de base en RMN..................................................................................... 11 2.3. Stratégies utilisées pour déterminer la structure des protéines par RMN.............. 14

2.3.1. Expression, marquage isotopique et purification des protéines...................... 14 2.3.2. Préparation des échantillons ........................................................................... 16 2.3.3. Acquisition des spectres RMN........................................................................ 17 2.3.4. Transformation des spectres en vue de leurs analyses.................................... 22 2.3.5. Contraintes structurales................................................................................... 23 2.3.6. Dynamique des protéines................................................................................ 28 2.3.7. Calcul de structures tridimensionnelles .......................................................... 29

CHAPITRE 3. MATERIELS ET METHODES............................................................... 32 3.1. Expression, marquage isotopique et purification de MTH187 .............................. 32 3.2. Préparation des échantillons .................................................................................. 33

3.2.1. Contenu des échantillons ................................................................................ 33 3.2.2. Concentration de la protéine dans l'échantillon .............................................. 34

3.3. Résonance magnétique nucléaire........................................................................... 34 3.4. Contraintes structurales.......................................................................................... 39

3.4.1. Contraintes NOEs ........................................................................................... 39 3.4.2. Contraintes d'angles dièdres............................................................................ 40

3.5. Génération de structures tridimensionnelles.......................................................... 41 3.6. Homologie structurale............................................................................................ 42

CHAPITRE 4. ATTRIBUTION DES SPECTRES RMN ET DÉTERMINATION DE LA STRUCTURE SECONDAIRE DE MTH187................................................................... 43

4.1. Attributions des spectres RMN.............................................................................. 43 4.1.1. Détermination des déplacements chimiques de la chaîne squelettique .......... 43 4.1.2. Attribution des déplacements chimiques des chaînes latérales...................... 47 4.1.3. Détermination des déplacements chimiques des résidus aromatiques........... 49

4.2. Synthèse de l’attribution ........................................................................................ 51 4.3. Structure secondaire de MTH187 .......................................................................... 53

CHAPITRE 5. STRUCTURE DE MTH187 ................................................................... 56 5.1. Calcul de structures de MTH187 ........................................................................... 56

5.1.1. Calculs avec CNS ........................................................................................... 56 5.1.2. Calcul avec ARIA/CNS .................................................................................. 57 5.1.3. Structures finales de MTH187........................................................................ 58

iv

5.1.4. Qualité des structures...................................................................................... 60 CHAPITRE 6. HOMOLOGIE STRUCTURALE ............................................................ 68 CHAPITRE 7. DISCUSSION .......................................................................................... 73

7.1. Attribution des déplacements chimiques de MTH187........................................... 73 7.2. Structure de MTH187 ............................................................................................ 74 7.3. Homologie structurale............................................................................................ 76

CHAPITRE 8. CONCLUSION ........................................................................................ 78 BIBLIOGRAPHIE............................................................................................................ 79 ANNEXE I........................................................................................................................ 82 ANNEXE II ...................................................................................................................... 83

v

Liste des équations Equation 1 : Équation de base en RMN. ν représente la fréquence de précession de

Lamor,(MHz), Bz est le champs magnétique. Le rapport gyromagnétique est une constante, qui dépend de la nature du noyau. ........................................................... 17

Equation 2: Relation entre le NOE (nuclear Overhauser effet) et la distance entre deux protons....................................................................................................................... 20

Equation 3 : Equation qui permet de connaître la constance de couplage 3JHNHα à partir du rapport d’intensité des pics et du délai d’acquisition des spectres (δ). ..................... 26

Equation 4: Équation de la RMSD (root mean square deviation). N est le nombre d’échantillon, i est la sommation sur chacun des échantillons. ri et ri

représente les ׳structure..................................................................................................................... 31

Equation 5 : I(t) est l’intensité après le délai t et I0 est l’intensité au t=0. ........................ 36

vi

Liste des tableaux

Table 1 : Table énumérant les paramètres d’acquisitions des différentes expériences RMN ......................................................................................................................... 38

Table 2 : Comparaison des méthodes de détermination de structures secondaires de MTH187.................................................................................................................... 55

Table 3 : Table des RMSD de la structure finale de MTH187 ......................................... 59 Table 4 : Statistiques structurales des structures RMN de MTH187 a.............................. 67 Table 5: Protéines identifiées par DALI comme étant structuralement homologues à

MTH187.................................................................................................................... 68 Table 6: Superposition des régions de MTH187 avec Aconitase B ................................. 70

vii

Liste des figures

Figure 1-1 : Histogramme représentant le nombre de gènes exclus de l’analyse de protéomique structurale (figure reproduite de ((Christendat et al., 2000))................. 4

Figure 1-2: Alignement de séquences des sous-unités α des phycocyanines phycocyanobilines lyases extraites de COG1413 généré avec ClustalW 1,74 (www.ch.embnet.org/software/ClustalW.html). La première colonne cite les abréviations des protéines de la famille COG1413. Les quatre premières protéines, dont la protéine étudiée MTH187, sont des protéines de Methanobacterium thermoautotrophicum d’où l’abréviation MTH. Le nombre à la suite est le numéro du gène. Les protéines suivantes proviennent des bactéries Pseudomonas aeruginosa, Bacillus subtilis, Bacillus halodurans, Mesorhizobium loti, Synechocystis sp. BOXSHADE (www.ch.embnet.org/software/BOX_form.html) est utilisé pour mettre en évidence les acides aminés identiques (boîtes noires) et semblables (boîtes grises). .......................................................................................... 6

Figure 2-1: Structure secondaire en hélice α. Les liaisons hydrogène entre les atomes d’azote et d’oxygène de la chaîne principale sont en points noirs. Les atomes d’azote sont en bleu et les atomes d’oxygène sont en rouge. Figure générée avec le logiciel MOLMOL................................................................................................................. 10

Figure 2-2: Représentation schématique des feuillets β parallèles et antiparallèles. Les groupements NH et CO de la chaîne principale sont liés par des liaisons hydrogène. Figure tirée du site Internet: http://tsailab.tamu.edu/biochem410/06-2-Structure.pdf................................................................................................................................... 10

Figure 2-3: Niveaux d’énergies et orientations des états de spins nucléaires du proton en absence et en présence d’un champ magnétique. La différence de population entre les deux niveaux d’énergies est beaucoup plus faible qu’illustré dans cette figure. (Figure tirée de www.rmn.uhp-nancy.fr/Mutzenhardt/RMNSV2CM1.pdf) ............ 12

Figure 2-4: Effets d’un champ magnétique externe sur un échantillon RMN. A) Transfert de la magnétisation le long des axes x et y. reproduite du livre ((Wüthrich, 1986). B) Rotation de la magnétisation autour de l’axe z.(reproduite du livre (Sanders, 1987).................................................................................................................................... 12

Figure 2-5: Retour à l’équilibre du moment magnétique avec la magnétisation orientée parallèlement à B0 (www.med.univ-rennes1.fr/cerf/edicerf/BASES/BA004_cv_rb_9.html). ........................................... 13

Figure 2-6: Signal RMN se traduisant par une décroissance du signal détecté en fonction du temps nommé FID (free induction decay). .......................................................... 13

Figure 2-7: Fonctions sinusoïdales FID où est appliquée une transformée de Fourier. (Figure tirée de www.rmn.uhp-nancy.fr/Mutzenhardt/RMNSV2CM1.pdf) ............ 14

Figure 2-8 : Diagramme qui résume les étapes de la détermination de structures tridimensionnelles d’une protéine par la méthode de résonance magnétique nucléaire (RMN)....................................................................................................................... 15

Figure 2-9: Déplacements chimiques observés pour les différents types de protons. Le spectre 1D a été enregistré dans une solution aqueuse. La FID est transformée par transformée de Fourier. Cette figure est reproduite de (Cavanagh et al., 1996)....... 18

viii

Figure 2-10: Corrélations obtenues lors de l’analyse d’un spectre 3D 15N-TOCSY-HSQC................................................................................................................................... 20

Figure 2-11: Corrélations obtenues lors de l’analyse d’un spectre 3D CBCA(CO)NH... 21 Figure 2-12: Corrélations obtenues lors de l’analyse d’un spectre 3D HNCACB. .......... 21 Figure 2-13: Corrélations obtenues lors de l’analyse d’un spectre 3D HNCO................. 21 Figure 2-14: Corrélations obtenues lors de l’analyse d’un spectre 3D HN(CA)CO. ....... 21 Figure 2-15 : Corrélations obtenues lors de l’analyse d’un spectre 3D HCCH-TOCSY . 22 Figure 2-16: Représentation d’une chaîne polypeptidique. L’angle de rotation autour de la

liaison N-Cα est l’angle phi(Φ) et celui autour de la liaison Cα-C’ est l’angle psi(ψ).Figure reproduite de http://www.ujf-grenoble.fr/BIO/Gurvan/phi_psi.html. 24

Figure 2-17 : Relation entre le déplacement chimique Cα et Cβ et la structure secondaire. Cette figure est tirée de http://spin.niddk.nih.gov/bax/software/TALOS/................ 25

Figure 2-18: Graphique de Karplus qui décrit la variation de la constante de couplage 3JHNHα avec l’angle dièdre Φ de la chaîne squelettique. ........................................... 26

Figure 2-19 : Graphique de Ramachandran montrant en ordonné l’angle dièdre ψ et en abscisse Φ. Les surfaces colorées marquées α, β et L sont approximativement les angles ψ et Φ retrouvés dans les hélices α droites, les feuillets β et les hélices α gauches. Figure reproduite de Branden and Tooze, 1991......................................... 27

Figure 2-20: Schéma qui représente la dynamique moléculaire d’un calcul de structures par recuit simulé (MDSA). a) représente le point de départ correspondant à un minimum d’énergies locales. b) montre qu’une augmentation de température permet de diminuer les barrières d’énergies et ainsi franchir une barrière plus facilement. c) représente un refroidissement lent de la température. En d) le minimum d’énergie globale est atteint. Figure tirée de www.bip.bham.ac.uk/osmart/bcm311_pef/slide27.html. ......................................... 30

Figure 3-1 : Vecteur d’expression pET-15b ..................................................................... 32 Figure 3-2: Région du vecteur d’expression pET-15b. (Novagen).................................. 33 Figure 3-3 : Script de transformation du spectre HCCH-TOCSY. Le symbole # désactive

la fonction qui suit et \ annonce une continuité de ligne.......................................... 37 Figure 4-1 : Spectres tridimensionnels de MTH187. 3D 15N-TOCSY-HSQC en beige, et

3D 15N-NOESY-HSQC en bleu. F1(1H), F3(1HN) montrés sur différent F2(15N). Les lignes blanches sur un même déplacement chimique en F1 relient les mêmes corrélations................................................................................................................ 43

Figure 4-2 : Spectres tridimensionnels de MTH187. CBCA(CO)NH en beige et HNCACB en bleu. F1(13C), F3(1HN) montrés sur différent F2(15N). Les lignes blanches sur un même déplacement chimique en F1 relient les mêmes corrélations. Le spectre HNCACB montre les corrélations Cα en noire et les Cβ en rouge. ........ 44

Figure 4-3: Spectres tridimensionnels de MTH187. HNCO en beige et HN(CA)CO en bleu. F1(CO), F3(1HN) montrés sur différent F2(15N). .............................................. 45

Figure 4-4: Plan 2D F1(13C), F3(1HN) du spectre tridimensionnel HN(CO)CA du résidu Phe 99 de la protéine MTH187. Le plan 15N est au déplacement chimique 126,86 ppm. .......................................................................................................................... 46

Figure 4-5 : Expansion du spectre 2D 13C-HSQC de MTH187 illustrant la région caractéristique des corrélations Hα-Cα. Les axes montrent les déplacements chimiques (δ) des atomes en partie par millions (ppm). Dans ce spectre à haute

ix

résolution où le couplage scalaire C-C est présent, les Cα des glycines donnent lieu à des doublets alors que les Cα des autres acides aminés donnent lieu à des triplets.. 47

Figure 4-6: Région sélectionnée F1(1H)-F3(1HN) du spectre 15N-TOCSY-HSQC de MTH187 situé à 118.7 ppm sur l’axe F2(15N).Les corrélations observées pour la leucine 31 sont indiquées. Les corrélations entre l’amide et les protons β sont très faibles, et les corrélations avec les protons γ et δ sont absentes dans ce spectre. ..... 48

Figure 4-7: Région sélectionnée F1(1H)-F3(1H) du spectre HCCH-TOCSY de MTH187 situé à 40.6 ppm sur l’axe F2(13C). Les corrélations observées pour la leucine 31 sont indiquées. Les corrélations entre les protons β et les protons γ sont très faibles dans ce spectre................................................................................................................... 48

Figure 4-8: Région sélectionnée F1(13C)-F3(1HN) du spectre CC(CO)NH de MTH187 situé à 108.8 ppm sur l’axe F2(15N). Les corrélations observées pour la leucine 31 sont indiquées. Les corrélations entre l’amide et les Cα, Cβ, Cγ et Cδ sont très bien visibles dans ce spectre. ............................................................................................ 49

Figure 4-9: Spectre 2D HCCH-COSY de MTH187, F3(1H)-F2(13C). La protéine MTH187 est dans une solution 100% D2O. Les corrélations positives (noires) correspondent au 13C ayant un nombre impair de carbone voisin et les corrélations négatives (bleu) au 13C ayant un nombre pair de carbone voisin. ...................................................... 50

Figure 4-10: Plan F1, F3 du spectre 3D HCCH-COSY de MTH187. MTH187 est dans une solution D2O. Les pics de la diagonale représentent les corrélations des protons et eux-même. Le proton Hδ corrèle avec le proton Hε du résidu 107. Les corrélations entre les protons Hζ2 et Hη2 du résidu 36 et Hδ-Hε du résidu 49 sont montré dans cette figure. ............................................................................................................... 51

Figure 4-11: : Spectre 2D 15N-HSQC de MTH187. Ce spectre montre les corrélations entre le proton (1H) et son 15N. Les pics reliés représentent les corrélations des deux protons avec leur azote des arginines et des asparagines.......................................... 52

Figure 4-12: Graphique montrant le résultat de l’analyse CSI pour la protéine MTH187. Les déplacements chimiques des 1Hα, 13Cα ,13Cβ ont été utilisés. La structure secondaire est résumée dans cette figure. Lorsque y =1, la structure secondaire favorisée est le feuillet β et lorsque y = -1 la structure secondaire favorisée est l’hélice. D’après l’analyse CSI, MTH187 est composée de 6 hélices α: Phe24-Ser30, Asn33-Trp44, Gly47-Leu61, Phe68-Ile80, Glu83-Ala93, Phe99-Glu109. Figure générée à partir du logiciel CSI (Wishart and Sykes, 1994)..................................... 53

Figure 4-13 : A) Graphique montrant le résultat du logiciel TALOS pour la protéine MTH187. Les déplacements chimiques des 1Hα , 13Cα ,13Cβ, CO et N ont été utilisés. Les régions vertes représentent les résidus où TALOS suggère une structure secondaire avec un niveau de confiance élevé. Les régions rouges représentent les régions où la structure secondaire est contradictoire (Bad). Les régions jaunes signifient des régions ambiguës et les régions grises correspondent aux régions non classées. L’analyse avec TALOS indique que MTH187 est composée de 6 hélices α: Glu25-Leu31, Arg37-Ile46, Val55-Glu63, Phe68-Ile80, Glu83-Ala93, Ala100-Glu109. B) Graphique de Ramachadran illustrant les angles dièdres du résidu central des dix tripeptides de la banque de données ayant des déplacements chimiques secondaires (secondary shifts) similaire à ceux du tripeptide R75-S76-L77. Cette analyse permet d’estimer les angles dièdres φ/ψ de S76 à –66 ± 9 / -37± 8............. 54

x

Figure 5-1 : Superposition de 30 structures de MTH187. 32ième lancement de calculs effectués par ARIA. La RMSD est de 0.66 Å pour la chaîne squelettique (résidus 24-109) et de 1.23 Å pour les atomes lourds entre les résidus 24 à 109 de la protéine.................................................................................................................................... 58

Figure 5-2 : Structure de MTH187 (haut : Vue en stéréo, bas : rotation de 90° de long de l’axe des X. Les calculs de structures tridimensionnelles ont été faits par ARIA et les structures ont été visualisées dans MOLMOL. Les six hélices α sont représentées. La structure montrée est la structure calculée dans l’eau où l’énergie est la plus basse parmi les 72 structures calculées............................................................................... 59

Figure 5-3 : Graphique de Ramachandran des 30 structures RMN des résidus 24-109 de MTH187. Les résidus Glycine sont représentés par des triangles. Les régions favorisées par les angles phi et psi sont les deux régions les plus foncées. Les régions moins permises mais acceptables sont d’une couleur grise intermédiaire et les régions non permises sont en gris très pâle. Le % des résidus situés dans les régions favorisées est de 90.7%. ............................................................................... 60

Figure 5-4 : (montrée dans les six pages suivantes) Graphique de Ramachandran des résidus 2 à 110 de la structure RMN de MTH187. Chaque point dans chaque graphique de Ramachandran représente les 30 structures générées. Chaque graphique de Ramachandran indique la conformation du squelette pour un résidu, et ce pour chacune des structures calculées. Les structures secondaires définies manuellement sur cette figure sont : hélice 1 (22-31), hélice 2 (36-49), hélice 3 (55-64), hélice 4 (68-80), hélice 5 (83-94), hélice 6 (100-109)....................................... 60

Figure 6-1 :Alignement des régions superposées entre l’Aconitase B (pdb ID 1l5j) et MTH187 obtenu par le programme DALI. L’identité entre les deux séquences pour les résidus 24-109 est de 21% et la similarité est de 35%. Les “ * ’’ signifient que les deux résidus alignés sont identiques. Les “.’’ signifient que les deux résidus sont semblables................................................................................................................. 69

Figure 6-2: Vue en stéréo de la superposition de MTH187 en bleu et de l’aconitase B (I.D.:1L5J) en rouge. Le logiciel utilisé pour visualiser est PYMOL. Le RMSD squelettique des résidus superposés est de 2.36Å..................................................... 69

Figure 6-3: Alignement des régions superposées entre AP2 (pdb1gw5) et MTH187. L’identité entre les deux séquences pour les résidus 24-109 est de 21% et la similarité est de 42%. Les “ * ’’ signifient que les deux résidus alignés sont identiques. Les “.’’ signifient que les deux résidus sont semblables....................... 70

Figure 6-4: Vue en stéréo de la superposition de MTH187 en bleu et de l’adapteur Ap2 (I.D.:1GW5) en rouge. Le logiciel utilisé pour la visualisation est MOLMOL. La RMSD de la chaîne squelettique de la région 24-109 de MTH187 et l’adapteur Ap2 est de 2.72Å. ............................................................................................................. 71

Figure 6-5: Structure tridimensionnelle de l’Aconitase B qui a tendance à former des dimères. Le jaune représente le motif de répétition qui ressemble au motif strcutral “Heat repeat’’. Le PDB ID de cette protéine est 1l5j-A. .......................................... 72

Figure 6-6: Structure tridimensionnelle de l’Aconitase B sous forme monomérique. La région en jaune représente la région ou la protéine MTH187 se superpose. Le PDB ID de cette protéine est 1l5j-A. ................................................................................. 72

1

CHAPITRE 1. INTRODUCTION

1.1. Vue d’ensemble du mémoire Ce projet de maîtrise vise à connaître la structure et la fonction d’une protéine de la

bactérie Methanobacterium thermoautotrophicum. Pourquoi cette protéine me direz-

vous? En fait une grande partie des structures des protéines du génome de

Methanobacterium thermoautotrophicum sont analysées, dû premièrement à la

disponibilité du génome et dans le but de comprendre entre autre la tolérance de cette

bactérie à supporter des températures élevées.

Ce mémoire est séparé en huit chapitres. Le premier chapitre explique la

protéomique structurale suivi d’une introduction à la cristallographie et à la résonance

magnétique nucléaire. Par la suite nous présenterons la bactérie Methanobacterium

thermoautotrophicum et la protéine étudiée dans le cadre de ce projet de maîtrise:

MTH187. Comme ce mémoire utilise principalement la RMN, le chapitre 2 est dédié au

principe théorique qui entoure la détermination de la structures des protéines par

résonance magnétique nucléaire. Suivant les Matériels et méthodes au chapitre 3, les

résultats sont présentés aux chapitres 4 à 6. Le chapitre 4 montre l’attribution des spectres

RMN et la détermination de la structure secondaire de la protéine. Le chapitre 5 présente

la structure tertiaire de la protéine et l’homologie de structures est décrit dans le chapitre

6. Le chapitre 7 discute ensuite des résultats et le mémoire se termine par une conclusion

au chapitre 8.

1.2. Protéomique structurale L’aire de la protéomique structurale commença lorsqu’en 1936 Mirsky et Pauling

proposèrent que la fonction d'une protéine soit liée à sa conformation, c’est-à-dire à

l'arrangement tridimensionnel de ses atomes dans l’espace (Anfinsen, 1973). Ces paroles

eurent un très grand impact sur la compréhension de la biologie et sur la découverte et la

conception de nouveaux médicaments (Russell and Eggleston, 2000). Depuis, l’étude des

structures tridimensionnelles de toutes les protéines d’un protéome, nommée protéomique

structurale, fournit un nouveau mode de raisonnement pour la biologie structurale (Hol,

2

2000). L’étude expérimentale de la structure des protéines est un processus long et

coûteux nécessitant des équipements majeurs et des connaissances très pointues. Les

deux méthodes principales utilisées en protéomique structurale, soit la cristallographie et

la RMN, sont présentées dans la section qui suit. Une description détaillée de la RMN

sera présentée au chapitre 2.

1.3. Cristallographie et RMN Jusqu’en 1985, la seule méthode permettant de déterminer la structure

tridimensionnelle d'une macromolécule était la cristallographie par diffraction des rayons

X. Cette technique nécessite l’obtention de cristaux de protéine bien ordonnés. Malgré le

développement constant de nouvelles méthodes de cristallisation, il est parfois très

difficile et même impossible d`obtenir des cristaux utilisables. Depuis quelques années,

grâce aux progrès réalisés dans le domaine de la spectroscopie par résonance magnétique

nucléaire (RMN), il est possible de déterminer la structure tridimensionnelle en solution

de petites protéines, particulièrement des protéines de moins de 200 acides aminés

(Cavanagh et al., 1996). Ceci est dû à la fabrication de spectromètres à haut champ, la

mise au point de techniques de RMN multidimensionnelle et les progrès de

l’informatique. La RMN permet entre autre d'estimer la distance des protons, ainsi que

certains angles dièdres. À partir de la connaissance d'un nombre important de données

RMN, il est possible de déterminer la structure d’une protéine avec une résolution de

l’ordre de celle obtenue par les rayons X.

L’accomplissement récent de plusieurs projets de génomique ont fourni aux

scientifiques des informations sur la séquence de plusieurs génomes. Puisque chaque

protéine dans un organisme a une importance biochimique, la détermination de la

structure tridimensionnelle de toutes les protéines d’un protéome va permettre une

meilleure compréhension structure/fonction des protéines d’un organisme. Par

conséquent, des projets de protéomique structurale ont récemment débuté à plusieurs

endroits dans le monde, en outre au Japon, en Europe et en Amérique du Nord

(Heinemann, 2000; Terwilliger, 2000; Yokoyama et al., 2000).

3

1.4. Mise en contexte et biologie de Methanobacterium thermoautotrophicum

Un des projets de protéomique structurale concerne la bactérie Methanobacterium

thermoautotrophicum appelée également Methanothermobacter thermoautotrophicus

(Boone, 2000). Cette archaebactérie se retrouve dans des environnements à haute

concentration de sels, sans présence d’oxygène et où la température se situe entre 40 °C

et 70 °C (Smith et al., 1997). La température de croissance optimale est de 65 °C. Cette

bactérie se retrouve principalement dans les milieux riches en matière organique tel la

boue et dans les intestins des ruminants entre autre des bétails et des moutons. Ces

microorganismes sont capables de fermenter les déchets des animaux et des humains,

pour produire le méthane. Le méthane est utilisé à des fins de carburant dans plusieurs

pays en voie de développement où il assure la lumière et la chaleur (Pelczar et al., 1993).

Les protéines d’archaebactéries partagent beaucoup de séquences et caractéristiques

fonctionnelles avec les protéines eucaryotes, mais les archaebactéries sont souvent plus

petites et plus robustes. Cette robustesse est due à la composition de la paroi cellulaire qui

contient des glycoprotéines, des protéines et des polysaccharides comparativement aux

eubactéries dont la paroi cellulaire est principalement composée de peptidoglycanes

(Pelczar et al., 1993). De part ces caractéristiques mentionnées plus haut, les

archaebactéries servent d'excellents modèles pour des analyses structurales (Christendat

et al., 2000).

Le génome de Methanobacterium thermoautotrophicum a été séquencé en 1996

(Smith et al., 1997). En l’an 2000, l’étude de protéomique structurale a été lancée sur 424

protéines des 1871 gènes du protéome de Methanobacterium thermoautotrophicum par

des chercheurs de l’OCI (Ontario Cancer Institute) dont Cheryl H. Arrowsmith et Aled

M. Edwards (Christendat et al., 2000).

Deux critères d`exclusions ont été mis en application dans le choix des protéines.

Premièrement, les protéines associées à la membrane qui recouvraient 30% du protéome

de Methanobacterium thermoautotrophicum ont été rejetées de l’analyse, car les

structures de protéines membranaires ne peuvent être caractérisées rapidement.

4

Également, les protéines ayant un homologue dont la structure est connue ont été exclues.

Les protéines qui ont des possibilités de nouveaux repliements sont favorisées pour

l’analyse. Ce dernier groupe contient 27% des protéines de Methanobacterium

thermoautotrophicum (Christendat et al., 2000). La Figure 1-1 donne un aperçu du

nombre de gènes exclus par rapport au poids moléculaire de la protéine.

Figure 1-1 : Histogramme représentant le nombre de gènes exclus de l’analyse de protéomique structurale (figure reproduite de ((Christendat et al., 2000)).

Plusieurs autres protéines n’ont pas été sélectionnées pour le projet de protéomique

structurale, car leurs probabilités de former de nouveaux types de repliements étaient

restreintes et leurs pertinences biologiques semblaient limitées (Christendat et al., 2000).

Comme mentionné plus tôt, 424 protéines de Methanobacterium

thermoautotrophicum ont été choisies pour le clonage, l’expression et l’étude des

structures tridimensionnelles. 34% ont une annotation fonctionnelle, 54% sont classifiées

comme étant des protéines conservées dans le génome et 12% comme ayant une fonction

inconnue (Christendat et al., 2000).

La détermination de la structure tridimensionnelle d’une protéine demande un

certain temps. Elle peut prendre plusieurs mois dépendamment de la longueur de la

protéine. Pour augmenter la rapidité des découvertes des structures, les chercheurs de

l'OCI (Ontario Cancer Institute) collaborent avec d’autres laboratoires RMN pour

l’analyse des échantillons de protéines. Jusqu’à maintenant, seize structures ont été

résolues dans six différents laboratoires de cristallographie et dix-sept structures ont été

5

résolues dans sept différents laboratoires de RMN (Yee et al., 2003). Le nombre presque

identique de structures déterminées avec la cristallographie et la RMN montre que la

spectroscopie RMN peut apporter une contribution significative à la protéomique

structurale (Yee et al., 2003).

1.5. Protéine MTH187 Une des nombreuses séquences choisies pour l’analyse de la structure

tridimensionnelle est l’objet du projet présenté dans ce mémoire. La protéine MTH187

possède 111 acides aminés (12.4kDa) et son point isoélectrique est de 4.93. La séquence

de MTH187 est une séquence conservée dans les génomes à travers l’évolution et de

fonction encore inconnue. Basé sur une analyse bioinformatique (Tatusov et al., 1997),

MTH187 a été classée dans une banque de données COG. Cette classification

phylogénique contient des protéines homologues de la même organisation provenant

d’une duplication de gène (Tatusov et al., 2001). MTH187 est classé plus précisément

dans la famille COG1413, une famille de sous unité α d’une phycocyanine

phycocyanobiline lyase. La Figure 1-2 montre l’alignement de MTH187 avec quelques

protéines faisant partie de cette famille.

MTH187 1 --------------------------------------------MADE------------ MTH1806 1 -------MVNARLKEMRLMEPQKRMEAIEKLEPSEESVEILIAFLEDESHPVRFKAAEKL MTH1715 61 FPSEESLRAIEKFVDHPSEDIRRNSIESIAGLDPELGLRYASRALGDSSWMVRKTAAKVI MTH1378 1 ---------------------------MFFMEGKR--IDFLLEELRNP------------ PA2293 61 G-----RRLLPWLGHADAFVRASVLRALRELRLEESAVPAL-AALGDPQAAVRREAVAVL BS_ypgR_2 1 -------------------------AHLEQMDPKEEDIPVLQKALDDP------------ BH1718_2 1 -------------------------AALDKMDPTEEDLPVLEKALQDE------------ BH2232 61 WSTRMNTLHRILEFRMKDLLDDVLNMLNENKHYSDDEYLQIYRILAAFQYEDFLQHLLNP mlr6693 61 EKGNGAERIHAAEMLAALRSENAVASLLSALDRDRSREVRIAAAIALCDLGSLPPLDIAL mlr9194 60 A-----DSILPLVSHGRAFVRAAGFRGLKALRSRGALAPAL-AAMRDEDANVRAQALGVV slr1687 10 AMTALTLEQIASQLDSPNSRDRLIALASLRPYSSEEAVPLIKKVLDDDTLQVRSMAVFAL sll1663 1 --MSDSLTAIKALLGSDNFSDKVRGLNQLRALEPAEAFPLLKPLVNDANPRIRYAAVSQL slr1098 32 PPPPDPDEMLVLLTSREAPQRMLAARAFCEIADRR-AVEPLINLLGDSCPLVRVSAAYAL MTH187 5 ------------------------NKWVRRDVSTALSR-----------MGDE-AFEPLL MTH1806 54 --AEFGEASLEKLMEIM----DTAEGEIRRYATFALKK-----------IGDPRVTDHFI MTH1715 121 RRFGDKRCLEVLLDNLN-----DPDTEVRRHILLAVVN-----------MGEY-AVDPLL MTH1378 20 ------------------------DWVVREDAVELLAE-----------VADPRAVGPLI PA2293 115 GWLRHQPALAELARLAS----ADVDPEVRRAATGALG------------LSREATVLPAL BS_ypgR_2 24 ------------------------KVSIRRQAVVYLGM-----------IETP-DVLPLL BH1718_2 24 ------------------------KASIRRLATVYLGM-----------IEKP-VVLPLL BH2232 121 KIEMNEMEYRKLLFELEEKPFLNMVEHYQDFPSALKHT-----------VLDMIGVKHLV mlr6693 121 GKVGVVGQRSRRLIELFRRFPPARFEELRDHAARTDAVP----------FIRAAAIDALA mlr9194 114 AYLKLEETLPS-LIAAT----RDAEAIVRSVAVNALSF-----------TSQP-AAAAAV slr1687 70 GIKQTEECYPILVKLLET----DGDYGIRADAAGALGY-----------LEDERAFHPLC sll1663 59 DPVGKADLEQS-LQLLRDRLFNDPEIDVQSVAADVIGG-----------LKLTAAYPDLQ slr1098 91 GRNTDPTIVEPLIQSLQ----TDFNGYVRKGLVWALGN-----------CGDRRALAPLI

6

MTH187 29 ES-------LSNEDWRIR-----------GAAAWIIGNFQDER-----------AVEPLI MTH1806 97 EA-------LSDEDWGVR-----------KFAARSLGELGDLR-----------AVEPLI MTH1715 164 EK-------LSDPQWQTR-----------AMVVEALGEIGSRR-----------AVPRLK MTH1378 45 EA-------LDDEDYHVR-----------EAAALALATFDDRM-----------AVEPLR PA2293 159 CAA------LADAQWQVR-----------EEAATTLGKLGREE-----------AGEPLL BS_ypgR_2 48 YKA------LEDKAVSVR-----------RTAGDCLSDIGDPQ-----------AIPAMI BH1718_2 48 EKA------LKDPSVTVR-----------RTAGDCMSDIGDPA-----------AIPAMI BH2232 170 QMVPFLEERIHDEELEVR-----------VRSLKALSQLGIVQ-----------NEKIYY mlr6693 171 RAAG-----FHFADFFARATGDQ----SPEVAAAALRALGLTG--------HAEAPAILA mlr9194 157 TAA------LDDENWQVR-----------AAAADTLGRIGQTS-----------AVDGLT slr1687 115 RAF------YEDTEWLVR-----------FSAAVALGNLKDIR-----------AQTVLL sll1663 107 KAY------EETPEWLLQ-----------MSIVATLGEMGDRR-----------GFDLLK slr1098 136 HA-------LKTDISAVR-----------LWSASSLPNIAKLAYE-----DVIATIPPLI MTH187 60 KLLE-----DDSGFVRSGAARSLEQIGGE------------------------------R MTH1806 128 AALD-----DEDWGVKLAAVRSLGDLGDER---------------------------AIE MTH1715 195 GMLAGRRR-DENRYVRGKVAEALGRIGDPAALEDLHMALRDPYLFVRRKAREAIDIIDVE MTH1378 76 EHLS-----DDKPGVRYACALALGILGDE------------------------------D PA2293 191 KALA-----DDYWQVRLRAARALGRLRHRP---------------------------ARE BS_ypgR_2 80 KSLS-----DSSKLVRWRAAMFLYEVGDES---------------------------AIE BH1718_2 80 EALK-----DKNKLVRWRAAMFLYEVGDET---------------------------AID BH2232 208 PFVE-----SENWEERMMVAKILANVDSPE---------------------------AVS mlr6693 214 SAMA-----NGDWDVRAAAADAAGRLGLAG----------------------------LA mlr9194 189 AGLS-----DEYWQVRQKCLNALGKLKAQS---------------------------AVR slr1687 147 EALK-----SDEAVVQQAAIAALGEIGAVD---------------------------AVD sll1663 139 IALD-----SENSLIRTAAISALGELGNPE---------------------------ALP slr1098 173 EGLRR----DKMAAVRSNCAWAVGQLCRELPSN-------------------VVYATAID MTH187 85 V-RAAMEK--------------------------LAETGTGFARKVAVNYLETH------ MTH1806 156 P-IKKARR--------------------------KGDKDFKKAANKSLKKIQSGR----- MTH1715 254 PDLEEFHDGEISFRYPRFWNIFETRDGERLIDAWSDNLKIAIKRRRAEGLTADEFSEIIL MTH1378 101 S-IPDLEE--------------------------LLDDESPMVRRVAEVAISEIRKRAA- PA2293 219 A-LEALLG--------------------------HPIGNLRKEAALALGELADPASAQAL BS_ypgR_2 108 A-LRAAED--------------------------DPEFEVSLQVKMALERIEHGEEAKGS BH1718_2 108 A-LRLAED--------------------------DPEFEVAMQVKMALERIVGGEEAKGS BH2232 236 S-LQHLLK--------------------------DQSWWVRSQAAQSIVQQKNGKSVLRA mlr6693 241 APLSALMD--------------------------DEAWTVRYAAANALRSFGQPGERLLR mlr9194 217 Q-ISELLT--------------------------SDLASLRKESAAALGEIADPSSRAVL slr1687 175 A-ILAFAS--------------------------HEDWLIRQRLVEALGNLPCDQSRSAL sll1663 167 L-LASLVQ--------------------------DEDWQVRYRLALAVGHLEHPDRQSLL slr1098 210 ALLEALVE--------------------------DEDFGVKEDAKSALLRLGDARGLQMI

Figure 1-2: Alignement de séquences des sous-unités α des phycocyanines phycocyanobilines lyases extraites de COG1413 généré avec ClustalW 1,74 (www.ch.embnet.org/software/ClustalW.html). La première colonne cite les abréviations des protéines de la famille COG1413. Les quatre premières protéines, dont la protéine étudiée MTH187, sont des protéines de Methanobacterium thermoautotrophicum d’où l’abréviation MTH. Le nombre à la suite est le numéro du gène. Les protéines suivantes proviennent des bactéries Pseudomonas aeruginosa, Bacillus subtilis, Bacillus halodurans, Mesorhizobium loti, Synechocystis sp. BOXSHADE (www.ch.embnet.org/software/BOX_form.html) est utilisé pour mettre en évidence les acides aminés identiques (boîtes noires) et semblables (boîtes grises).

Une protéines portant une fonction de phycocyanine phycocyanobiline lyase se

trouvent généralement chez les cyanobactéries et les algues rouges (Fairchild et al.,

1992), bref, plusieurs organismes vivant dans les eaux peu profondes, tièdes et calmes.

Ces protéines participent à la photosynthèse (Voet and Voet, 1995). Jusqu’à maintenant,

7

neuf structures des phycocyanines ont été déterminées par cristallographie des rayons X

mais aucune par RMN.

Afin d’approfondir les connaissances de la protéine MTH187, nous avons

déterminé la structure tridimensionnelle de celle-ci. Étant donné le nombre de résidus

inférieurs à 200, la méthode choisie est la RMN.

1.6. Buts du projet de maîtrise Un des objectifs de ce projet est de déterminer, à l’aide de la RMN, la structure

tridimensionnelle de la protéine MTH187 qui pourrait servir de base pour déterminer sa

fonction. La fonction d’une nouvelle protéine peut potentiellement se déterminer par

homologie séquentielle c'est à dire par l’alignement de MTH187 avec des protéines

puisées dans une base de données qui contient des fragments de séquences semblables.

Les fonctions de ces protéines ont été déterminées soit expérimentalement ou par

homologie séquentielle. La fonction peut se déterminer également par homologie

structurale qui consiste à comparer la structure repliée de MTH187 avec d'autres

protéines repliées dont on connaît la fonction dans le but de repérer des structures

semblables dans l’espace et d’identifier le site actif de la protéine. C’est à ce moment que

la RMN intervient dans le projet.

Le travail effectué permettra d’obtenir une première structure tridimensionnelle de

protéine dans le laboratoire du Dr Gagné. Par la suite il sera plus facile de caractériser

d'autres protéines car les problèmes survenus au cours de ce projet pourront être évités.

Cette protéine, tout comme toutes les protéines de Metanobacterium

thermoautotrophicum, est stable à 65oC contrairement à plusieurs autres protéines,

retrouvées chez d’autres bactéries, qui se dénaturent à haute température. Les types

d’acides aminés retrouvés chez MTH187, les différents liens entre ceux-ci et l’analyse de

la conformation tridimensionnelle permettront de définir des règles générales, et de

potentiellement connaître les raisons pour lesquelles cette protéine tolère des

températures plus élevées.

8

La structure tridimensionnelle de MTH187 pourra également permettre

d’effectuer de la modélisation moléculaire pour d’autres protéines de Metanobacterium

thermoautotrophicum principalement les protéines retrouvées dans la famille COG1413:

MTH1806, MTH1715 et MTH1378. Cette modélisation permettra de soulever des

hypothèses sur les structures tridimensionnelles de ces trois protéines.

9

CHAPITRE 2. DÉTERMINATION DE LA STRUCTURE DES PROTÉINES PAR

RÉSONANCE MAGNÉTIQUE NUCLÉAIRE

La résonance magnétique nucléaire (RMN) est une technique spectroscopique très

utilisée. La très grande variété de spectres permet entre autre de déterminer la structure

tridimensionnelle de protéines en solution. La section suivante vise à présenter un survol

des concepts théoriques de la RMN et à introduire les stratégies utilisées pour déterminer

la structure d’une protéine par RMN.

2.1. Niveaux de structure des protéines Une protéine est composée d’une série d’acides aminés reliés par des liens

peptidiques. Cette chaîne primaire se replie et s’organise pour former des structures

secondaires. Parmi ces structures, il y a entre autre les hélices α, les feuillets β, les coudes

β et les structures désordonnées. L’interaction entre les atomes de chaque acide aminé

ainsi que l’encombrement stérique influence la structure secondaire.

L’hélice α demeure un élément classique de structure de protéines. L’hélice α a 3.6

acides aminés par tour d'hélice et des liaisons hydrogène entre les groupements CO d’un

acide aminé I et NH d’un acide aminé I+4 (Figure 2-1).

Le feuillet β est constitué de la combinaison de brins β. Ces brins sont alignés côte

à côte pour former des liaisons hydrogène entre les groupements CO d’un brin et les

groupements NH d’un autre brin. Lorsque l’orientation des brins sont dans la même

direction, il s’agit d’un feuillet β parallèle. Lorsque les acides aminés dans les brins

successifs ont des directions opposées, c’est un feuillet β antiparallèle (Figure 2-2)

(Branden and Tooze, 1991).

10

Figure 2-1: Structure secondaire en hélice α. Les liaisons hydrogène entre les atomes d’azote et d’oxygène de la chaîne principale sont en points noirs. Les atomes d’azote sont en bleu et les atomes d’oxygène sont en rouge. Figure générée avec le logiciel MOLMOL.

Figure 2-2: Représentation schématique des feuillets β parallèles et antiparallèles. Les groupements NH et CO de la chaîne principale sont liés par des liaisons hydrogène. Figure tirée du site Internet: http://tsailab.tamu.edu/biochem410/06-2-Structure.pdf

Résidu I + 8

Résidu I + 4

Résidu I

11

D’autres types de structures secondaires, tels les coudes, peuvent être rencontrés

dans les protéines. Les coudes permettent à la protéine de se replier afin de favoriser un

changement de direction. Enfin, beaucoup de protéines présentent des régions

désordonnées. Ces portions de protéines oscillent dans la solution, car peu de forces sont

présentes pour les maintenir en place (Voet and Voet, 1995).

Le repliement des structures secondaires forme la structure tertiaire. Ce repliement

est stabilisé par des interactions électrostatiques et/ou hydrophobes qui déterminent la

conformation de la protéine et son activité biologique. Beaucoup de protéines sont

constituées de plusieurs chaînes polypeptidiques (sous-unités) qui sont réunies par des

interactions non covalentes et quelques fois par des ponts disulfure. La structure

quaternaire désigne l’arrangement dans l’espace de ces sous-unités.

2.2. Principes de base en RMN La RMN repose sur l’analyse des propriétés magnétiques des noyaux atomiques.

Les noyaux des atomes engendrent l’existence d’un moment cinétique propre au noyau

appelé spin I. Le spin prend comme valeurs 0, 1/2, 1, 3/2, et ainsi de suite (I=0 signifie

qu’il n’y a pas de spin). Cette quantification du spin implique celle du moment

magnétique µ qui lui est associé (µ = γI). En effet, le fait d’avoir un spin non nul confère

aux particules les propriétés d'un dipôle magnétique. Une particule de spin 1/2 soumise à

un champ magnétique possède un moment magnétique qui peut prendre deux

orientations, dans le même sens que le champ B0 et dans le sens opposé. Le proton 1H,

les noyaux 13C, 19F ou 31P ont un spin de 1/2 et donc deux états de spins: +1/2 et –1/2.

Pour un spin égal à un, tel que celui du deutérium 2H ou le lithium 6Li, il y a trois

orientations possibles:-1, 0 et +1 (Evans, 1995). Plus généralement, il y a 2I+1

orientation pour un spin I.

Lorsque l’échantillon est soumis à un champ magnétique, à chacune de ces

orientations correspond un niveau d’énergie. Pour le proton dont le nombre de spin vaut

1/2, il existe deux niveaux d’énergies, avec un léger excès de population sur le niveau

d’énergie le plus bas (distribution de Boltzmann)(Figure 2-3). Ce sont les transitions

12

entre ces niveaux qui constituent le phénomène de résonance magnétique nucléaire

(Sanders and Hunter, 1987).

Figure 2-3: Niveaux d’énergies et orientations des états de spins nucléaires du proton en absence et en présence d’un champ magnétique. La différence de population entre les deux niveaux d’énergies est beaucoup plus faible qu’illustré dans cette figure. (Figure tirée de www.rmn.uhp-nancy.fr/Mutzenhardt/RMNSV2CM1.pdf)

Pour observer un signal, il faut rompre l’équilibre entre les deux niveaux

d’énergies, peuplant davantage le niveau supérieur. L’échantillon doit être soumis à un

deuxième champ magnétique (produit par une source de radiations électromagnétiques

appelées impulsion) perpendiculaire au premier champ produit par l’aimant. La

magnétisation globale sera transférée dans le plan x, y. Dès que l’impulsion est terminée,

le moment magnétique tourne autour de Bo et la magnétisation globale induit un courant

électrique dans la bobine du récepteur (“receiver coil’’) (Cavanagh et al., 1996) (Figure

2-4).

Figure 2-4: Effets d’un champ magnétique externe sur un échantillon RMN. A) Transfert de la magnétisation le long des axes x et y. reproduite du livre ((Wüthrich, 1986). B) Rotation de la magnétisation autour de l’axe z.(reproduite du livre (Sanders, 1987).

13

Comme présenté à la Figure 2-5 , l’aimantation globale M, va rejoindre sa position

initiale, c’est-à-dire parallèle à Bo. M revient à sa position initiale progressivement par un

phénomène de relaxation (Cavanagh et al., 1996).

Figure 2-5: Retour à l’équilibre du moment magnétique avec la magnétisation orientée parallèlement à B0 (www.med.univ-rennes1.fr/cerf/edicerf/BASES/BA004_cv_rb_9.html).

C’est dans cette période de retour à l’équilibre que les données sont enregistrées par

le spectromètre RMN. Les noyaux de la protéine vont résonner à différentes fréquences

dépendant en autre de l’environnement dans lequel ils se trouvent. Le signal enregistré est

une FID (free induction decay). On retrouve à la Figure 2-6 un exemple d’une FID.

Figure 2-6: Signal RMN se traduisant par une décroissance du signal détecté en fonction du temps nommé FID (free induction decay).

Ces signaux contiennent toutes les informations nécessaires, mais dans un

langage difficile à interpréter. Ils sont traités par la transformée de Fourier qui permet de

14

rendre visible un signal sinusoïdal qui est fonction du temps (y=f(t)) en le changeant en

un spectre RMN qui est fonction de la fréquence (y=f(ω))(Figure 2-7). Les fréquences de

résonance sont ensuite récupérées (Cavanagh et al., 1996).

Figure 2-7: Fonctions sinusoïdales FID où est appliquée une transformée de Fourier. (Figure tirée de www.rmn.uhp-nancy.fr/Mutzenhardt/RMNSV2CM1.pdf)

2.3. Stratégies utilisées pour déterminer la structure des protéines par RMN

Dans cette section, il sera question des étapes nécessaires à la détermination de la

structure d’une protéine. Ces étapes sont présentées à la page suivante (Figure 2-8).

2.3.1. Expression, marquage isotopique et purification des protéines Les analyses par RMN nécessitent de grandes quantités de protéines à l’état pur; il

est donc souvent nécessaire de surexprimer la protéine. À ce titre, en utilisant les

techniques standards de génétique, le gène d’intérêt est cloné dans un plasmide d`ADN

qui, une fois inséré dans les bactéries, est exprimé en très grande quantité.

Certains noyaux ne sont pas observables par la RMN faute de spins nucléaires

(I=0). Ainsi, pour des noyaux fondamentaux de la chimie organique tels 12C, et 16O nous

ne pourrons observer de phénomène de RMN. Ces atomes ont cependant des isotopes

naturels ayant un spin nucléaire non nul. Le 13C de spin 1/2 est retrouvé à 1.11% dans la

nature. Outre sa faible abondance naturelle, cet isotope possède un rapport

gyromagnétique quatre fois plus faible que celui du proton. Donc, ces deux facteurs

induisent une sensibilité très faible pour le 13C en spectroscopie RMN. Le 17O de spin 5/2

est beaucoup moins abondant que le 13C dont l’observation conduit à des raies spectrales

très larges et peu exploitables par une analyse RMN.

15

Les noyaux 14N, qui ont un spin de 1, sont visible par RMN, mais il est préférable

en RMN liquide de marquer l’azote afin de lui donner un état de spin 1/2. Ce marquage

diminue le nombre de niveaux d’énergies à deux au lieu de trois et facilite par conséquent

l'analyse. L’15N de spin 1/2 est moins abondant que le 13C dans la nature, il est retrouvé à

0.37 % (Cavanagh et al., 1996; Voet and Voet, 1995). Il donne de bons signaux RMN.

Son rapport gyromagnétique est dix fois plus petit que celui du proton.

Figure 2-8 : Diagramme qui résume les étapes de la détermination de structures tridimensionnelles d’une protéine par la méthode de résonance magnétique nucléaire (RMN).

Expression, marquage isotopique et purification des protéines

Préparation des échantillons

Attribution des spectres

Contraintes structurales

Calculs des structures tridimensionnelles

Famille de structures

Acquisition des spectres RMN

Expression, marquage isotopique et purification des protéines

Préparation des échantillons

Attribution des spectres

Contraintes structurales

Calculs des structures tridimensionnelles

Famille de structures

Acquisition des spectres RMN

16

Afin de contrer ces difficultés, il est possible de marquer uniformément les atomes

de carbone et d’azote aux 13C et 15N lors de l’expression de la protéine. Du chlorure

d'ammonium marqué (15NH4Cl) et du glucose marqué (13C-glucose) sont utilisés comme

seule source d'azote et de carbone dans le milieu de culture. Ce marquage isotopique des

protéines est essentiel afin de pouvoir analyser une multitude d’expériences RMN

multidimensionnelles.

Il peut parfois être utile de remplacer les protons par des deutériums afin d’alléger

les spectres des grosses protéines. Afin de produire une protéine deutérée, la croissance

des bactéries est effectuée dans le D2O en remplacement de H2O.

Les protéines recombinantes sont ensuite purifiées et leurs structures sont

caractérisées par RMN.

2.3.2. Préparation des échantillons La protéine dont la structure tridimensionnelle est analysée par RMN se doit d’être

dans une concentration et un environnement adéquat. La concentration de protéines pures

nécessaires dans un échantillon varie entre 0.5 et 2.0 mM. Cette concentration favorise un

signal par rapport au bruit satisfaisant et permet l’acquisition des spectres en un temps

approprié.

L’échantillon ne peut contenir d’impureté, du moins pas d’impureté contenant des

protons car ceux-ci interfèrent avec les protons de la protéine. Des sels et des ions

peuvent se retrouver dans la solution. Une concentration minimum de sels va offrir à la

protéine un environnement similaire à son milieu naturel, mais une concentration trop

élevée va nuire à celle-ci car les sels sont des éléments conducteurs et peuvent réchauffer

l’échantillon lors des impulsions.

La protéine peut se trouver à l’état de monomère ou de multimère. Les multimères

sont formés par l’agrégation de plusieurs molécules en solution. Lorsqu’il y a un échange

des deux conformations dans un échantillon étudié par RMN, les pics dans les spectres

deviennent plus larges. C’est pour cette raison qu’il est préférable de retrouver qu’une

seule conformation dans un échantillon.

17

La protéine doit être stable c’est-à-dire qu’elle doit demeurer active et garder sa

structure durant quelques semaines et ce à des températures parfois élevées. Le pH de

l’échantillon est très important pour observer tous les protons de la protéine. Le pH varie

généralement entre 5 et 7. Un pH trop élevé accélère l’échange des protons échangeables

avec le solvant.

Le solvant utilisé est généralement l’eau. 10% de D2O est ajouté à l’échantillon

pour verrouiller le spectromètre à une seule fréquence durant l’acquisition d’un spectre

(Cavanagh et al., 1996). En effet, étant donné que le champ magnétique varie

continuellement d’une infime valeur, une impulsion est lancée continuellement sur le

D2O afin d’ajuster la fréquence de référence des noyaux de la protéine. La fréquence de

résonance est référencée par une petite quantité (0.5mM) de DSS (sodium 2,2-dimétyl-2-

silapentane-5-sulfonate) ajoutée à l’échantillon.

2.3.3. Acquisition des spectres RMN L’acquisition de plusieurs spectres RMN permet d’identifier les fréquences de

résonance de tous les noyaux d’un composé. Cependant, la fréquence de résonance d’un

noyau est proportionnelle au champ magnétique appliqué. Il n’est donc pas commode de

repérer le déplacement chimique en fréquence puisque ce repère dépend du champ utilisé,

donc de l’appareil. La mesure utilisée est le déplacement chimique en ppm (partie par

million) (Cavanagh et al., 1996). En guise de simple exemple, un proton dans un champ

magnétique de 14 Tesla (T) résonne à 600MHz tandis que dans un champ magnétique dix

fois plus petit (1.4092 T), le proton résonne à 60 MHz. Le calcul peut être fait à partir de

l’Equation 1.

ν = γ Bz2л

Equation 1 : Équation de base en RMN. ν représente la fréquence de précession de Lamor,(MHz), Bz est le champs magnétique. Le rapport gyromagnétique est une constante, qui dépend de la nature du noyau.

Les noyaux d’un composé ne résonnent pas tous à la même fréquence. Les

protons résonnent typiquement entre –1 et 12 ppm (Figure 2-9), les carbones aliphatiques

résonnent typiquement entre 17 et 75 ppm et les azotes des amides typiquement entre 100

18

et 132 ppm. Le déplacement chimique est influencé par l’environnement local, c’est-à-

dire par les noyaux et les électrons qui se situent à proximité. Un élément électronégatif

tel un azote ou un oxygène déblinde un proton. Le déplacement chimique sera alors plus

élevé.

Figure 2-9: Déplacements chimiques observés pour les différents types de protons. Le spectre 1D a été enregistré dans une solution aqueuse. La FID est transformée par transformée de Fourier. Cette figure est reproduite de (Cavanagh et al., 1996)

Dans les spectres de résonance magnétique nucléaire de plus d’une dimension, un

pic est formé au déplacement chimique de la corrélation entre deux noyaux. Les

corrélations enregistrées entre les noyaux de la protéine peuvent être différentes d’un

spectre à l’autre. Elles peuvent s’effectuer entre les liens d’un même acide aminé ou à

travers l’espace. Certains spectres RMN aideront davantage à l’attribution squelettique,

c'est-à-dire la détermination des déplacements chimiques des noyaux sur la chaîne

principale, et d’autres types de spectres se consacreront davantage à déterminer les

déplacements chimiques sur les chaînes latérales.

19

Les expériences RMN homonucléaires sont basées sur un seul type d’atome: les

protons. Deux types d’expériences homonucléaires utilisées sont le COSY qui corrèle les

protons couplés et le TOCSY (Braunschweiler and Ernst 1983). où les corrélations sont

entre tous les protons faisant parties du même système de spin (Cavanagh et al., 1996).

Plusieurs acides aminés ont un système de spins bien à eux. Prenons exemple sur le

résidu alanine. Ce résidu est caractérisé par un pic très intense pour le groupement

méthyle situé en Hβ. En fait, ce pic est trois fois plus intense que le Hα. Il sera donc

possible d’associer plusieurs groupements de déplacements chimiques à un type d’acide

aminé. Par la suite, il sera important de relier ces acides aminés ensemble. Le spectre

NOESY est également une expérience RMN homonucléaire. Les outils pour attribuer une

séquence sont les NOEs qui seront détaillés un peu plus loin dans cette section.

Lors de l’analyse de plus grosses protéines, où il est nécessaire de marquer certains

résidus, des expériences RMN hétéronucléaires dont les spectres peuvent atteindre

jusqu’à quatre dimensions sont acquisitionnées.

Le spectre 15N-TOCSY-HSQC (Clore et al., 1991) de trois dimensions, dont la

protéine est marquée à 15N, révèle des corrélations à travers les liens d'un même acide

aminé (Figure 2-10). Cette expérience est acquisitionnée au spectromètre RMN en

induisant premièrement une impulsion de 90°. L’aimantation devient alors

perpendiculaire au champ de l’aimant. L’aimantation tourne autour de l’axe z et le

déplacement chimique des protons est alors mesuré au temps d’évolution t1. Ensuite, il y

a un temps de mélange où chaque proton transmet son aimantation à travers les liens aux

autres protons situés sur le même résidu. L’aimantation est transférée sur 15N par un

transfert INEPT et ainsi crée une deuxième dimension. Seulement les protons HN seront

transférés durant INEPT. Le déplacement chimique du 15N est enregistré durant le temps

d’évolution t2. Finalement, un INEPT inversé sera utilisé pour transférer l’aimantation sur

le 1HN et le déplacement chimique de celui-ci est enregistré au temps d'évolution t3

(Cavanagh et al., 1996).

Figure 2-10: Corrélations obtenues lors de l’analyse d’un spectre 3D 15N-TOCSY-HSQC

Comme mentionné plus haut, pour déterminer la structure d’une protéine il est

nécessaire de joindre tous les systèmes de spins des acides aminés. Les corrélations

NOEs (nuclear Overhauser effet) sont des corrélations dipolaires entre deux protons

situés à proximité dans l’espace (Cavanagh et al., 1996). Plus la distance entre deux

atomes est grande plus l’intensité de la corrélation NOEs est faible. Pour qu’il y ait

corrélation, la distance ne doit pas dépasser 5Å. Cette relation est inversement

proportionnelle et se réfère à la relation suivante.

Equatio

TOCS

d'hydr

très él

spectre

adjace

princip

corréla

D

squele

HNCA

spectre

précèd

NOE % 1/ r6

20

n 2: Relation entre le NOE (nuclear Overhauser effet) et la distance entre deux protons

L’expérience 15N-NOESY-HSQC (Ikura et al., 1990) est similaire au 15N-

Y-HSQC sauf que les spectres NOESY enregistrent des corrélations entre atomes

ogène près dans l’espace. En plus des corrélations entre les atomes d’hydrogène

oignés dans la séquence (distance maximum de 5Å une fois la protéine repliée), ce

RMN enregistre les corrélations entre les atomes d’hydrogène de résidus

nts, principalement les corrélations de l’hydrogène lié à l'azote de la chaîne

ale du résidu n avec les hydrogènes liés à N, Cα et Cß du résidu n-1. Ces

tions sont très utiles pour l’attribution séquentielle.

’autres spectres peuvent être acquisitionnés dans le but de déterminer la chaîne

ttique d’une protéine. L’expérience CBCA(CO)NH (Grzesiek et al., 1992) et

CB (Kay et al., 1990) utilisent la protéine marquée à 15N et au 13C. Ces deux

s donnent des informations concernant le déplacement chimique des Cα et Cβ qui

ent un acide aminé quelconque à partir du 1HN et 15N. Le HNCACB donne en plus

21

le déplacement chimique du 13Cα et du 13Cß de ce résidu. Un aperçu des corrélations sont

illustrées à la Figure 2-11 et Figure 2-12.

Figure 2-11: Corrélations obtenues lors de l’analyse d’un spectre 3D CBCA(CO)NH

Figure 2-12: Corrélations obtenues lors de l’analyse d’un spectre 3D HNCACB.

Une des expériences hétéronucléaires les plus sensibles acquisitionnées sur un

spectromètre RMN est le HNCO. Cette expérience pour laquelle la protéine doit être

marquée à 15N et au 13C donne les déplacements chimiques du groupement CO qui

précède un acide aminé à partir du HN (Figure 2-13). Même chose pour le HN(CA)CO

(Clubb R.T, 1992) qui, en plus, révèle les déplacements chimiques du groupement CO

sur un même acide aminé (Figure 2-14).

Figure 2-13: Corrélations obtenues lors de l’analyse d’un spectre 3D HNCO.

Figure 2-14: Corrélations obtenues lors de l’analyse d’un spectre 3D HN(CA)CO.

22

L’acquisition de tous ces spectres devrait résoudre en bonne partie l’attribution de

la chaîne squelettique d’une protéine. Pour attribuer les chaînes latérales de tous les

acides aminés d’une protéine, différents spectres peuvent être acquisitionnés. Certains

résidus contiennent une longue chaîne latérale difficilement attribuable à partir de

seulement l’analyse d’un 15N-TOCSY-HSQC.

Le spectre HCCH-TOCSY (Olejniczak et al., 1992) où la protéine est marquée au 13C donne les corrélations entre les protons d'un même acide aminé (Figure 2-15).

Contrairement au spectre 15N-TOCSY-HSQC, ces corrélations ne sont pas entre l’amide

et les protons d’un même acide aminé mais bien entre tous les CH situés sur un même

acide aminé. Celles-ci se répéteront sur différents plans autant de fois qu'il aura de CH.

Figure 2-15 : Corrélations obtenues lors de l’analyse d’un spectre 3D HCCH-TOCSY

Comme visualisé à la Figure 2-9, les composés aromatiques résonnent sensiblement

à la même fréquence que les amides de la chaîne squelettique. Il est difficile de les

analyser dans les spectres décrits précédemment. Par contre, ces protons aromatiques sont

non échangeables avec le solvant et les amides sont échangeables. Le milieu permettant

de caractériser les protons aromatiques est le D2O. En solution, les protons échangeables

seront deutérés. Les protons aromatiques seront présents sur les spectres appropriés.

2.3.4. Transformation des spectres en vue de leurs analyses Les signaux RMN émis lors de l’acquisition d’un spectre doivent subir quelques

modifications avant leurs analyses. La transformation des spectres implique plusieurs

fonctions mentionnées ci-dessous.

23

- Extraction du solvant

- Prédiction linéaire

- Multiplication du signal fid par une fonction mathématique

- Zéro filling

- Transformée de Fourier

L’extraction du solvant est une fonction qui supprime le signal émis par le solvant.

Cela permettra de visualiser un grand nombre de corrélations qui pouvaient se retrouver

sous les pics du solvant. La multiplication du signal fid par une fonction mathématique a

beaucoup de bienfait sur les spectres. Par exemple, l’application d’une fonction

sinusoïdale à la fid par rapport à l’application d’une fonction cosinus augmente la

résolution mais diminue le rapport signal sur bruit. L’application d’une fonction cosinus

comparativement à la fonction sinus augmente le rapport signal sur bruit mais donne des

raies plus larges. La prédiction linéaire ajoute des points qui sont prédits à partir des

points expérimentaux. La fonction suivante, Zéro filling, permet d’ajouter des zéros à la

fin du signal pour améliorer la résolution d’un spectre.

La transformée de Fourier convertit la fid en spectre de fréquence (Figure 2-7).

Cette fonction est exécutée sur toutes les dimensions d’un spectre. Les avantages de son

utilisation sont entre autres sa rapidité et le fait que les signaux s’additionnent, mais que

le bruit ne s’additionne pas.

D’autres fonctions sont utilisées afin d’améliorer davantage les spectres RMN. Une

fonction permet entre autre d’ajuster la phase, une autre permet d’appliquer une

correction polynomiale de la ligne de base. Les fonctions ajoutées, par essais et erreur à

la fid, permettent de générer des spectres de meilleures qualités.

2.3.5. Contraintes structurales Différentes contraintes structurales telles que les NOEs (Nuclear Overhauser

Effect), et les angles dièdres sont nécessaires afin de déterminer la structure des protéines

24

par RMN. Les contraintes de ponts hydrogène et bien d’autres contraintes non présentées

dans ce mémoire peuvent également être utilisées pour déterminer la structure de la

protéine.

2.3.5.1. Contraintes de distances Les contraintes NOEs fournissent des informations sur les distances entre atomes

voisins. Ces distances, à moins de 5Å, peuvent être intra-résidu ou inter-résidus

(séquentielle, moyenne portée, longue portée). L’expérience 15N-NOESY-HSQC permet

de connaître les corrélations entre amides et les protons à proximité dans l’espace.

L’expérience 13C-NOESY-HSQC donne les corrélations entre tous les protons attachés à

un carbone. Chaque proton lié à un carbone de chaque résidu aura des corrélations avec

tous les protons attachés sur un carbone près dans l’espace. Ce spectre n’est souvent pas

attribué entièrement, car plusieurs pics se chevauchent fréquemment.

L’interaction entre deux atomes, perçue à partir de l’intensité de la corrélation,

permet d’évaluer leurs distances à partir de la relation précédemment citée (Equation 2).

Cette calibration des NOEs est nécessaire pour le calcul des structures.

2.3.5.2. Contraintes d’angles dièdres Dans une protéine, les liaisons adjacentes à la liaison peptidique C-N peuvent

tourner autour de leurs axes. Ainsi, le trajet d'une protéine dans l’espace est défini par une

série de plans articulés entre eux au niveau des carbones α (Figure 2-16).

Figure 2-16: Représentation d’une chaîne polypeptidique. L’angle de rotation autour de la liaison N-Cα est l’angle phi(Φ) et celui autour de la liaison Cα-C’ est l’angle psi(ψ).Figure reproduite de http://www.ujf-grenoble.fr/BIO/Gurvan/phi_psi.html.

L’orientation de ces deux plans est définie par l'angle phi (Φ) et l'angle psi (ψ). Au

même titre que les distances NOEs, ces angles peuvent être utilisés comme contraintes

structurales. Deux méthodes sont généralement utilisées en RMN pour déterminer les

25

angles dièdres. L’utilisation de la relation entre le déplacement chimique et la structure

secondaire (par exemple l'approche TALOS) démontré à la Figure 2-17 et les constantes

de couplage.

Figure 2-17 : Relation entre le déplacement chimique Cα et Cβ et la structure secondaire. Cette figure est tirée de http://spin.niddk.nih.gov/bax/software/TALOS/

TALOS (Torsion Angle Likelihood Obtained from Shift and sequence similarity)

TALOS est un système de banques de données qui permet d’évaluer les angles Φ

et ψ à partir du déplacement chimique de cinq atomes: Hα, Cα, Cβ, CO, N (Cornilescu et

al., 1999). TALOS utilise une suite de trois acides aminés dans une protéine et compare

les variations de déplacements chimiques (forme séquentielle à repliée) des cinq derniers

atomes avec des tripeptides de variations semblables dans une banque de données. Cette

banque de données contient actuellement des données de 20 protéines de structures

connues représentant environ 3000 triplets. Les dix tripeptides comportant des

déplacements chimiques de similarité supérieure avec les déplacements chimiques de la

protéine cible sont gardés. Si ces derniers sont en accord, c’est-à-dire qu'ils se situent

dans au moins 9 cas sur 10 dans la même région cohérente du graphique de

Ramachandran, la prévision est classifiée comme étant satisfaisante.

26

La méthode de TALOS est empirique, les valeurs d’angles sont donc imprécises et

l’incertitude sur les valeurs est importante. TALOS donne de bien meilleurs résultats

lorsqu’il est utilisé en conjugaison avec la mesure des constantes de couplage.

2.3.5.3. Constantes de couplages La constante de couplage est la séparation en hertz des pics de protons couplés.

Pour déterminer la protéine en trois dimensions, la constante de couplage la plus

fréquemment utilisée est celle entre le HN et le Hα. L’expérience RMN HNHA (Geerten

W. Vuister, 1993) est utilisée pour définir ces constantes de couplage (3JHNHα). Le spectre

HNHA comporte trois dimensions (F1(15N), F2(1H), F3(1HN)(Cavanagh et al., 1996). Sur

ce spectre, le rapport des corrélations entre le pic transversal et le pic diagonal pour un

même résidu est proportionnel à 3JHNHα. À l’aide de l’équation mathématique présentée

ci-dessous, la valeur de 3JHNHα est déterminée.

= -tan2 (2π3 JHNHα δ)= -tan2 (2π3 JHNHα δ)

Equation 3 : Equation qui permet de connaître la constance de couplage 3JHNHα à partir du rapport d’intensité des pics et du délai d’acquisition des spectres (δ).

Une fois les constantes de couplages obtenues pour tous les acides aminés de la

protéine étudiée, il suffit grâce à la relation de Karplus (Harbison, 1993) présentée à la

Figure 2-18 de transposer les constantes de couplages en contraintes d’angles dièdres Φ

(phi).

Figure 2-18: Graphique de Karplus qui décrit la variation de la constante de couplage 3JHNHα avec l’angle dièdre Φ de la chaîne squelettique.

Scross Sdiagonal

27

Lorsque la constante de couplage d'un résidu est plus petite que 6 Hz, l’angle Φ se

retrouve autour de 60 degrés soit une structure secondaire en hélice α. Lorsqu’elle est

plus grande que 8 Hz, l’angle phi est autour de 120 degrés (feuillet β). Lorsqu’elle se

situe entre 6 et 8 Hz la constante de couplage n’est pas utilisée comme contrainte

structurale car les régions flexibles d’une protéine donnent lieu à une constante de

couplage dans cet intervalle. (Cavanagh et al., 1996).

Ces contraintes dihédriques Φ et ψ aideront aux calculs de structures des protéines.

Dépendamment des angles, une région formera une structure secondaire en feuillet β ou

en hélice α. Le diagramme de Ramachandran montre les régions Φ et ψ où il est plus

favorable de former des hélices α et des feuillets β.

phi

psi

phi

psi

phiphi

psipsi

Figure 2-19 : Graphique de Ramachandran montrant en ordonné l’angle dièdre ψ et en abscisse Φ. Les surfaces colorées marquées α, β et L sont approximativement les angles ψ et Φ retrouvés dans les hélices α droites, les feuillets β et les hélices α gauches. Figure reproduite de Branden and Tooze, 1991.

2.3.5.4. Contraintes de ponts hydrogène La liaison hydrogène est une interaction électrostatique entre un atome d’hydrogène

rattaché à un atome électronégatif et une paire d'électrons libres situés sur un atome (O, S

ou N) d'un autre groupement. La distance de la liaison hydrogène varie de 2,7 à 3,1 Å

28

(Van Holde and Mathews, 1990). Les contraintes de ponts hydrogène peuvent être

connues en mesurant la vitesse d’échange des amides lorsque la protéine est dissoute

dans le deutérium. Une série de spectres est acquisitionnée à de faibles intervalles de

temps. Le deutérium n’est pas visible dans un spectre RMN 1H donc plus le temps est

long avant la disparition du pic, plus le proton est difficilement échangeable avec le

solvant d’où la présence potentielle d’un pont hydrogène.

D’autres contraintes structurales peuvent être utilisées pour déterminer la structure

tridimensionnelle des protéines, mais ils n’ont pas été utilisés dans cette étude.

2.3.6. Dynamique des protéines La relaxation est le processus par lequel les spins des noyaux dans l'échantillon

reviennent à l'équilibre après avoir été excités. L’état de l'équilibre est l'état dans lequel

les populations des niveaux d’énergies correspondent à une distribution de Boltzmann. Le

taux de relaxation est influencé par les propriétés physiques et dynamiques de la

molécule. Ainsi, une étude de relaxation permettra de connaître les propriétés

dynamiques de la molécule. Afin de caractériser ces propriétés, certains paramètres sont

mesurés.

Tout d’abord, les temps de relaxation T1 (appelé parfois longitudinal ou spin-

réseau) caractérisent le retour à l’équilibre énergétique des noyaux après l’excitation.

Cette relaxation est due aux interactions avec le milieu environnant. Les temps de

relaxation transversale T2 (appelé aussi spin-spin) permettent également ce retour à

l’équilibre, mais le long des axes x et y (Levitt, 2001). Typiquement, 15N-T1 et 15N-T2

sont analysés pour la dynamique du squelette. De plus, {1H}15N-NOE est également dû à

la relaxation. Ces valeurs de temps de relaxation NOE sont mesurées.

La mesure de ces paramètres de relaxation permet d’extraire les paramètres de

dynamique suivant: le temps de corrélation globale (τc), le temps de corrélation local (τe),

et les paramètres d’ordre S2. Le temps de corrélation globale (τc) est le temps moyen dont

une molécule en solution a besoin pour accomplir une rotation d’un radian. Le temps de

corrélation local (τe) a la même signification que τc mais concernant un acide aminé. Les

29

paramètres d’ordre (S2) considèrent l’amplitude d’un acide aminé. Plus la valeur est

élevée, plus la région est rigide.

2.3.7. Calcul de structures tridimensionnelles La simulation de structures tridimensionnelles s’effectue à l’aide de toutes les

informations connues jusqu’à maintenant sur la protéine. La séquence de la protéine et les

contraintes structurales mentionnées ci-haut sont les éléments essentiels qui sont utilisés

dans les logiciels de calculs. Le but est de générer une famille de structures en accord

avec les contraintes expérimentales, tout en conservant la géométrie des acides aminés et

des liens peptidiques.

Un programme, nommé ARIA, développé au cours des dernières années est un des

programmes d'analyses automatisées des données RMN. Il accélère entre autre l'analyse

des données expérimentales en attribuant des corrélations dans les spectres NOESY.

ARIA possède également son propre système de calibration de NOE (Linge et al., 2001).

ARIA procède à 8 calculs itératifs dont la dernière itération subit une simulation

dans l’eau. Dans chacune de ces itérations, ARIA attribue, calibre et calcul un ensemble

de structures tridimensionnelles avec le logiciel CNS (Brunger et al., 1998; Linge et al.,

2001; Wishart and Sykes, 1994). Les simulations de structures peuvent se faire selon

deux méthodes : le mode Cartésien ou le mode Torsion. Le mode Cartésien tient compte

des coordonnées de chaque atome et les fait varier jusqu’à l’obtention de plus faibles

énergies où la structure est la plus probable en fonction des contraintes imposées. Le

mode torsion quant à lui varie des angles de torsion pour minimiser l’énergie présente

dans la structure.

La simulation des structures se fait à température élevée pour permettre le plus

grand nombre de mouvements structuraux qui seraient impossible à température

ambiante. Afin de ne pas rester emprisonné dans un minimum d’énergie locale c’est-à-

dire une énergie où il serait possible d’avoir des énergies encore plus basses, les calculs

de structures ont été faits par recuit simulé (simulated annealing) où la température

diminue palier par palier (Figure 2-20). Cette méthode permet aux structures générées de

30

se stabiliser avant chaque changement de température. Les structures de plus basses

énergies sont gardées pour l’itération suivante.

a)

b) d)

c)a)

b) d)

c)

Figure 2-20: Schéma qui représente la dynamique moléculaire d’un calcul de structures par recuit simulé (MDSA). a) représente le point de départ correspondant à un minimum d’énergies locales. b) montre qu’une augmentation de température permet de diminuer les barrières d’énergies et ainsi franchir une barrière plus facilement. c) représente un refroidissement lent de la température. En d) le minimum d’énergie globale est atteint. Figure tirée de www.bip.bham.ac.uk/osmart/bcm311_pef/slide27.html.

La dynamique moléculaire de type recuit simulé n’est pas assurée de converger

vers un minimum d’énergie globale. Elle peut parfois rester dans un minimum local. Ces

structures sont perceptibles par leurs énergies totales très élevées. Elles sont alors

rejetées. Les structures comportant les plus basses énergies totales et le minimum de

violations de contraintes structurales sont conservées. L’analyse des violations, c’est-à-

dire des contraintes structurales non respectées lors du calcul de structure est effectuée

par la suite et les calculs de structures sont repris de nouveau. Cette étape de raffinement

est reprise jusqu’à ce que la structure soit satisfaisante.

Dans un calcul de structures tridimensionnelles RMN, les structures générées sont

superposées afin de déterminer la qualité et la précision de celles-ci. Plus les structures

sont similaires, plus la valeur du RMSD (root mean square deviation) sera faible. Les

31

RMSD peuvent être calculés selon le squelette, les atomes lourds (C, O, N,S) ou bien

différentes sections de la séquence protéique. Le RMSD est calculé suivant l’équation

suivante.

Equation 4: Équation de la RMSD (root mean square deviation). N est le nombre d’échantillon, i est la sommation sur chacun des échantillons. ri et ri

.représente les structure ׳

Les régions N-terminale et C-terminale de la protéine sont souvent non structurée et

libre en solution d’où le RMSD plus élevé. Les boucles (régions entre deux structures

secondaires) ont généralement un RMSD supérieur aux régions structurées telles les

hélices α et les feuillets β. Pour visualiser et manipuler les structures tridimensionnelles,

plusieurs logiciels sont disponibles. Swiss PDB Viewer, Inside II et Molmol (Koradi,

1996) ne sont que quelques exemples.

32

CHAPITRE 3. MATERIELS ET METHODES

3.1. Expression, marquage isotopique et purification de MTH187

La réaction en chaîne de la polymérase (PCR) a été utilisée pour amplifier la région

codante du gène MTH187. Ce gène a été cloné dans le vecteur d'expression procaryotique

pET-15b (Novagen) au site de restriction Nde1 et BamH1 (Figure 3-1). Au site N-

terminal de ce vecteur se trouve une séquence His-Tag suivie par un site de clivage de la

thrombine (Figure 3-2). Cette construction résulte en 20 résidus supplémentaires en N-

terminal (MGSSHHHHHHSSGLVPRGSH).

Figure 3-1 : Vecteur d’expression pET-15b

33

Figure 3-2: Région du vecteur d’expression pET-15b. (Novagen)

La protéine recombinante fut exprimée dans des cellules E. coli BL21(λDE3)

(Novagen). Les cellules ont poussé dans un milieu minimum M9 contenant des

suppléments de vitamines et de minéraux. La seule source d’azote et de carbone sont des

composés marqués. Le chlorure d'ammonium marqué: 15NH4Cl et/ou le 13C-Glucose.

Grâce à la séquence His-Tag, il a été possible de purifier la protéine à l’aide d'une

colonne de nickel.

Ces étapes d'expression et de purification ont été faites à Toronto dans le

laboratoire de Cheryl H. Arrowsmith. La méthode d’expression et de purification de la

protéine est décrite par (Christendat et al., 2000).

3.2. Préparation des échantillons

3.2.1. Contenu des échantillons Le premier échantillon a été préparé à Toronto dans le laboratoire de Cheryl H.

Arrowsmith. La protéine de cet échantillon est marquée uniquement à 15N. La protéine

est dissoute dans une solution de 600µl de tampon d’acétate de sodium 25mM à pH 6.2,

90% H2O : 10% D2O. La solution contient également 10mM de chlorure de sodium à une

concentration 10mM, 0,5mM de DSS(2,2-diméthyl-2-silapentane-5-sulfonate) et 22mM

de CHAPS. Le CHAPS ((3-[(Cholamidopropyl)diméthylammonio]-1-propane-sulfonate)

est utilisé pour que la protéine reste sous forme monomère dans l’échantillon. Un

échange entre monomère et dimère cause un élargissement les raies dans un spectre

RMN, donc le spectre devient plus difficile à interpréter.

34

Le deuxième échantillon dans lequel la protéine MTH187 est marquée à 15N et au 13C a été également préparé à Toronto. Les concentrations de CHAPS et de sels ont été

ajustées pour que les déplacements chimiques des atomes dans les spectres soient

semblables à ceux pris avec le premier échantillon.

Lors de l’analyse des résidus aromatiques, nous avons lyophilisé le deuxième

échantillon, ajouté 600µl de D2O à 99.996% et laissé reposer pour la nuit. Par la suite,

nous avons lyophilisé à nouveau pour enlever tout excès d'eau et redissous dans 600µl de

D2O 99.996%. 0.1% d’azide a également été ajouté à l’échantillon pour éviter la

croissance de bactéries. Le pH est vérifié à l’aide du pH-mètre et/ou l’imidazole. Pour

l’imidazole, une concentration dans l'échantillon de 2mM est ajoutée comme référence.

L’imidazole sert de référence de pH interne via la relation entre le pH et le déplacement

chimique d’un des pics de l’imidazole.

3.2.2. Concentration de la protéine dans l'échantillon Pour le deuxième échantillon, la concentration de MTH187 a été mesurée à l'aide

d'un dosage bicinchoninic acid (BCA) de la compagnie PIERCE.

3.3. Résonance magnétique nucléaire Comme le spectromètre RMN 600MHz du laboratoire n'était pas encore installé,

l'acquisition des spectres de l'échantillon dans lequel la protéine est marquée à 15N s'est

effectuée au centre national de résonance magnétique nucléaire (NANUC) situé à

Edmonton en Alberta. Le spectre 3D 15N-TOCSY-HSQC (Clore et al., 1991) a été

acquisitionné sur le spectromètre 500MHz et le spectre 3D 15N-NOESY-HSQC (Ikura et

al., 1990) sur le spectromètre 800MHz. Les autres spectres ont tous été acquisitionnés sur

le spectromètre RMN Varian INOVA 600MHz de l'université Laval à une température de

43.2°C. La température d’un échantillon fait varier le déplacement chimique donc, c'est

en ce référent au déplacement chimique des atomes des spectres acquisitionnés à

Edmonton que cette température nous ai apparu comme étant la meilleure.

L’attribution des déplacements chimiques des noyaux 1H, 15N, 13C a été réalisée en

utilisant plusieurs expériences RMN hétéronucléaires multidimensionnelles. Les

expériences suivantes ont été utilisées pour l'attribution de la chaîne squelettique: 3D 15N-

35

NOESY-HSQC, 3D 15N-TOCSY-HSQC, 3D CBCACONH (Grzesiek et al., 1992), 3D

HNCACB (Kay et al., 1990), 3D HNCO (Muhandiram, 1994), 3D HN(CA)CO (Clubb

R.T, 1992), 3D HCA(CO)N (Palmer et al., 1992), 3D HN(CO)CA (Bax and Ikura, 1991)

et le 2D 13C-HSQC (Muller, 1979). Les spectres 3D 15N-TOCSY-HSQC, 3D HCCH-

TOCSY (Olejniczak et al., 1992) et 3D CC(CO)NH (Lyons et al., 1993) ont été

acquisitionnés pour attribuer les chaînes latérales.

Ces derniers spectres ne permettent pas d’attribuer les déplacements chimiques des

groupements aromatiques. L’acquisition des spectres HCCH-COSY de deux et de trois

dimensions ont par conséquent été utilisés pour compléter l’attribution des Phe, Tyr et

Trp. Pour bien visualiser les corrélations entre les noyaux aromatiques, la protéine a été

dissoute dans le D2O.

Lors de la détermination de la structure tridimensionnelle de MTH187, des

contraintes d’angle dièdre ont été obtenues à partir de constantes de couplages 3JHNHα,

lesquelles ont été mesurées en utilisant l’expérience HNHA (Geerten W. Vuister, 1993).

Les contraintes NOEs ont été obtenues avec l’utilisation de deux expériences le 15N-

NOESY HSQC et le 13C-NOESY HSQC. Tous les deux ont un temps de mélange de

150ms.

L’échantillon dont la protéine est marquée à 15N et 13C a été utilisé pour les

expériences de relaxation dans une solution tampon 90% H2O et 10% D2O. Le pH a été

ajusté sur 6.2 avec HCl et/ou NaOH avant le transfert au tube RMN. Les expériences 15N-

T1, 15N-T2 et 15N-{1H}-15N ont été exécutées en utilisant les séquences d'impulsions de

(Farrow et al., 1994). Les T1 et T2 ont été acquisitionnés en utilisant les délais suivant.

Pour T1, des délais de [0,10,20,40,80,160,320,640 et 1280 ms] ont été utilisés et pour les

T2 ce sont des délais de [10,30,50,70,90,110,150 et 190 ms]. Après la transformation des

spectres, les intensités des pics ont été évaluées pour chaque délai donné pour calculer les

valeurs de T1 et de T2 de chaque résidu selon l’Equation 5. L’ajustement des données

(curvefitting) a été fait avec le logiciel curvefit (Mandel et al., 1995). L’incertitude sur les

valeurs de T1 et T2 a été calculée d’après la simulation de Jackknife. Elle consiste à

36

estimer des variances de manière à tenir compte de l’imputation de valeurs au moyen des

poids de rééchantillonnage (Shao, 1989).

I(t) = I0 e (–t/T1) et I(t) = I0 e (–t/T2)I(t) = I0 e (–t/T1) et I(t) = I0 e (–t/T2)

Equation 5 : I(t) est l’intensité après le délai t et I0 est l’intensité au t=0.

Pour le calcul des NOEs un spectre 15N-HSQC est acquisitionné avec effet NOE,

c’est à dire en saturant les protons, et un autre HSQC est acquisitionné sans effet NOE.

Par la suite, nous avons divisé les intensités du spectre avec NOE par celles du spectre

sans NOE.

Les T1, T2 et NOEs ont été calculés pour 78 acides aminés des 111 acides aminés

de MTH187. Ces acides aminés sont: 12,17-19, 24, 27, 30-56, 58-60, 63-66, 69-74, 76-

86, 88-98, 100, 101, 104-111.

C’est à l’aide du logiciel de Modelfree (Mandel et al., 1995) que l’on a pu calculer

le temps de corrélation de MTH187 dans l’eau. Le logiciel utilise des constantes

R1(1/T1), R2 (1/T2) et NOEs pour trouver le temps de corrélation global (τc). Pour obtenir

le temps de corrélation de la protéine MTH187 dans une solution de deutérium, nous

avons utilisé un rapport de viscosité D2O/H2O de 8.9 mpoise.

Les spectres ont tous été transformés à l’aide du logiciel NMRPipe (Delaglio et al.,

1995). Les fonctions typiques de transformation utilisées pour l’extraction de solvant sont

la fonction SOL, qui a été utilisée pour la grande majorité des spectres, et la fonction

POLY utilisée entre autre pour le spectre 13C-NOESY-HSQC. La fonction multiplicative

utilisée pour les fids des spectres est la fonction sinusoïdale ou cosinus. Le nombre de

point prédit lors de la prédiction linéaire dans une dimension donnée a toujours été la

quantité de points acquisitionnés dans cette même dimension. De plus, celle-ci a toujours

été effectuée après que deux dimensions aient été transformées. Le nombre de zéro ajouté

lors de la fonction zéro filling est le double du nombre de points acquisitionnés et prescrit

dans une dimension. De plus cette valeur doit être une puissance de deux. La Figure 3-3

37

montre un exemple typique de script de transformation en trois dimensions. Les

paramètres d’acquisitions de toutes les expériences sont mentionnés à la Table 1.

# Processing of F3 dimension (1H) # xyz2pipe -in data/pipe%03d.fid -x -verb \ | nmrPipe -fn POLY -time \ | nmrPipe -fn SP -off 0.3 -end 1.00 -pow 1 -c 1.0 \ | nmrPipe -fn ZF -auto \ | nmrPipe -fn FT \ | nmrPipe -fn PS -p0 90.00 -p1 0 -di \ | nmrPipe -fn EXT -x1 5.0PPM -xn -0.6PPM -sw \ | pipe2xyz -out DAT/3d%03d.DAT -x -ov # # Processing of F2 dimension (C) without LP # xyz2pipe -in DAT/3d%03d.DAT -z -verb \ | nmrPipe -fn SP -off 0.5 -end 0.95 -pow 1 -c 1.0 \ | nmrPipe -fn ZF -size 128 \ | nmrPipe -fn FT -di \ | pipe2xyz -out DAT/3d%03d.DAT -z -inPlace # # Processing of F1 dimension (1H) with LP # xyz2pipe -in DAT/3d%03d.DAT -y -verb \ | nmrPipe -fn LP -fb -pred 128 \ | nmrPipe -fn SP -off 0.3 -end 1.00 -pow 2 -c 1.0 \ | nmrPipe -fn ZF -size 512 \ | nmrPipe -fn FT \ | nmrPipe -fn PS -p0 0 -p1 0 -di \ | pipe2xyz -out DAT/3d%03d.DAT -y -inPlace # # Re-Processing of F2 dimension (C) with LP # xyz2pipe -in DAT/3d%03d.DAT -z -verb \ | nmrPipe -fn HT \ | nmrPipe -fn FT -inv \ | nmrPipe -fn ZF -inv \ | nmrPipe -fn SP -off 0.500 -end 0.95 -pow 1 -c 1.0 -inv \ | nmrPipe -fn LP -fb -pred 32 \ | nmrPipe -fn SP -off 0.5 -end 1.00 -pow 2 -c 1.0 \ | nmrPipe -fn ZF -size 128 \ | nmrPipe -fn FT \ | nmrPipe -fn PS -p0 -7.0 -p1 0 -di \ | pipe2xyz -out DAT/3d%03d.DAT -z -inPlace # # Base-line correct F1 (indirect 1H) dimension # xyz2pipe -in DAT/3d%03d.DAT -y -verb \ | nmrPipe -fn POLY -auto -ord 1 \ | pipe2xyz -out DAT/3d%03d.DAT -y -inPlace # # Base-line correct z dimension # xyz2pipe -in DAT/3d%03d.DAT -z -verb \ | nmrPipe -fn POLY -auto -window 5 -ord 1 \ | pipe2xyz -out DAT/3d%03d.DAT -z –inPlace

Figure 3-3 : Script de transformation du spectre HCCH-TOCSY. Le symbole # désactive la fonction qui suit et \ annonce une continuité de ligne.

38

Les spectres transformés ont été analysés en utilisant le programme NMRview

(Johnson B. A., 1994). Une fois tous les spectres attribués, un logiciel nommé Fillshifts

(Laboratoire du Dr Stéphane Gagné, Université Laval) activé à partir de NMRview a

permis de calculer une moyenne de tous les déplacements chimiques retrouvés dans les

spectres. Le fichier résultant regroupe les valeurs moyennes de déplacements chimiques

de tous les atomes de la protéine.

Table 1 : Table énumérant les paramètres d’acquisitions des différentes expériences RMN

dimensions nb. de points complexes

largeur spectrale

temps d'acquisition

prédiction linéaire

dimensions finales (nb de points finales)

15N TOCSY HSQC 1HN 512 8 000 aucune 1536

tm = 100ms 1H 141 5 997 115 768

15N 32 1 418 32 192 15N NOESY HSQC 1HN 768 12 000 aucune 1792

tm = 150ms 1H 200 10 000 200 912

15N 32 2 269 32 192 13C NOESY HSQC H1(F3) 512 10 000 179 h 30 aucune 1536

H2(F1) 128 7 676 128 768

13C 63 6 032 64 383

CBCACONH 1HN 750 10 000 71 h 30 aucune 1774

13C 70 12 064 70 268

15N 27 1 800 27 118

HNCO 1HN 750 10 000 20 h aucune 1774

13C 60 2 000 60 376

15N 32 1 800 32 192

HNCACB 1HN 750 10 000 69 h aucune 1774

13C 69 12 064 58 383

15N 27 1 800 32 187

HCCH-TOCSY 1H 640 10 000 aucune 1664

1HN 128 8 000 128 768

13C 32 12 066 32 192

HN(CA)CO 1HN 640 10 000 140 h aucune 1664

13C 60 2 000 60 376

15N 32 1 800 32 192

CC(CO)NH 1HN 750 10 000 aucune 1774

13C 128 12 064 128 512

15N 32 1 800 32 192

39

dimensions nb. de points complexes

largeur spectrale

temps d'acquisition

prédiction linéaire

dimensions finales (nb de points finales)

HN(CO)CA 1HN 750 10 000 86 h aucune 1774

13C 128 4 524 32 480

15N 32 1 800 32 192

HCA(CO)N 1HN 750 10 000 89 h aucune 1774

15N 36 1 800 36 200

13C 30 4 524 30 188 13C -HSQC 1H 750 10 000 aucune 1774

13C 512 15 080 256 1792

HNHA 1H 750 10 000 55 h aucune 1774

1HN 86 8 000 42 384

15N 32 1 800 32 192

HCCH-COSY 1H 512 10 000 79 h 45 aucune 1536

1H 128 6 000 128 768

13C 32 5 000 32 192 15N-T1 1HN 512 10 000 31 h 30 aucune 1536

15N 64 1 800 64 640 15N-T2 1HN 512 10 000 30 h 15 aucune 1536

15N 64 1 800 64 640 15N-NOE 1HN 512 10 000 28 h 40 aucune 1536

15N 64 1 800 64 640

3.4. Contraintes structurales

3.4.1. Contraintes NOEs Les corrélations NOEs ont été obtenues par l’analyse de deux spectres: le 15N-

NOESY-HSQC et le 13C-NOESY-HSQC. Le spectre 15N-NOESY-HSQC a été attribué

manuellement. Plusieurs NOEs de ce spectre ont été identifiés lors de l’attribution des

atomes de la chaîne squelettique avec l’aide du spectre 15N-TOCSY-HSQC. Les autres

NOEs ont été attribués après l’attribution de plusieurs autres spectres mentionnés plus

hauts.

Le spectre 13C-NOESY-HSQC contient davantage de corrélations NOEs. Ce

spectre a été partiellement attribué. Les attributions ont été appuyées par un script

confectionné par le docteur Gagné qui détermine les corrélations symétriques dans le

40

spectre et suggère différentes attributions. Le jugement d’un évaluateur est nécessaire

pour décider de l'attribution.

La calibration des NOEs de ces deux spectres a été faite pour les calculs de

structures tridimensionnelles. La majorité des calculs des structures de MTH187 ont été

calculés dans un mode de torsion avec un protocole recuit simulé utilisant le logiciel

ARIA version 1.2. Ce logiciel peut calibrer les NOEs. La calibration des NOEs dans le

spectre 13C-NOESY-HSQC a été réalisée uniquement à l’aide du système de calibration

contenu dans Aria. L’intensité du pic est calibrée en une distance et sur cette valeur une

erreur est ajoutée. Pour la calibration des HN, la conception d'un algorithme a été mise

aux points par Etienne Enoumen du laboratoire de Stéphane Gagné à l’université Laval.

La distance minimum est de 1.7 Å. Au fur et a mesure de sa conception, sa fiabilité a été

testée par rapport au système de calibration d'Aria.

3.4.2. Contraintes d'angles dièdres

3.4.2.1. TALOS Les angles phi et psi ont été estimés pour chaque résidu de MTH187 avec le

système de banques de données de TALOS (Cornilescu et al., 1999). Les déplacements

chimiques des atomes Hα, Cα, Cβ, CO, N furent utilisés et la comparaison des

déplacements chimiques s’est effectuée avec les 20 protéines dans la banque de données

de TALOS. La contrainte est acceptée si la corrélation est bonne dans au moins 9 cas sur

10. L’erreur minimum utilisée pour ces contraintes d’angles dièdres est de 14 degrés pour

le phi et 13 degrés pour le psi.

3.4.2.2. Constantes de couplages Les constantes de couplages entre les HN et les Hα des résidus de la protéine

MTH187 ont été mesurées à l’aide du spectre RMN HNHA. La période de couplage H-H

est de 25 ms.

Le spectre HNNA a été attribué à l’aide du logiciel NMRView. Les constantes de

couplages furent calculées avec l’outil d’analyse HNHA inclus avec NMRView. Les

paramètres nécessaires aux calculs des constantes sont le temps de mélange de 25 ms.

Une déviation standard de 0.02 et un facteur de correction de 0.86 furent utilisés. L’erreur

41

minimum utilisée pour les constantes de couplage est de ± 1,0 Hz. Les constantes de

couplage sont utilisées directement dans le logiciel CNS pour des calculs de structures.

3.4.2.3. Pont Hydrogène

L’échantillon dissous dans le D2O a été lyophilisé et redissout dans l'eau. Treize

spectres 15N-HSQC ont été acquisitionnés un à la suite de l’autre sur une période de 4

heures et comparés afin de déterminer quel est le temps d'échange de chaque groupement

NH.

Les contraintes de ponts hydrogène furent utilisées qu’à partir du dix-huitième

calcul de structures. Une contrainte de pont hydrogène fut définie pour les amides ayant

un échange lent avec le solvant et possédant un pont hydrogène potentiel dans le cycle de

calcul précédent. La contrainte de pont hydrogène a été définie sous forme de contrainte

de type NOE avec une distance de 2.1-3.2 Å.

3.5. Génération de structures tridimensionnelles La majorité des calculs de structures de MTH187 ont été calculés dans un mode de

torsion avec un protocole recuit simulé utilisant le logiciel ARIA version 1.2. Les calculs

de structures du logiciel ARIA se sont fait selon les valeurs de défauts offertes par le

logiciel. Dans la première étape, la température est augmentée à 10000 Kelvin. Par la

suite la température est passée de 10000 Kelvin à 1000 Kelvin en 5000 étapes de

dynamiques moléculaires. La deuxième étape de 1000 Kelvin à 50 Kelvin et ce, en

l’espace de 4000 étapes de dynamiques moléculaires. Les principaux paramètres utilisés

sont les contraintes de distances et les contraintes d’angles dièdres. Les contraintes de

distances, incluant les ponts hydrogènes, n’ont pas été utilisées à la première itération.

Lors du chauffage, 10 contraintes de distances ont été utilisées. Ensuite, au premier

refroidissement le nombre est monté à 50 et au deuxième refroidissement 50 contraintes

de distances ont également été utilisées. Pour les contraintes d’angles dièdres, 5

contraintes ont été utilisées lors du chauffage, 25 au premier refroidissement et 200 au

deuxième. Beaucoup d’autres paramètres interviennent dans les calculs de structures mais

les valeurs de défaut ont été utilisées.

42

Les calculs ont été exécutés à l’aide d’un ordinateur DELL Précision 650 (deux

processeurs) sous le système d'exploitation Linux. Les structures sont visualisées avec le

logiciel MOLMOL. Parmi les structures possédant un RMSD bas, la structure possédant

la plus basse énergie globale s'est révélée être la structure choisie pour analyse plus

profonde, entre autre pour l'homologie structurale.

3.6. Homologie structurale Les logiciels utilisés pour la recherche d'homologues structuraux à MTH187 sont

DALI (distance matrix alignment) (Holm and Sander, 1996) et CE (Combinatorial

Extension) (Shindyalov, 1998). Les coordonnées de la meilleure structure en format PDB

ont été soumises aux programmes pour y trouver des structures homologues dans les

banques de données de structures connues.

Ces homologues ont été superposés un à un avec MTH187 à l’aide du logiciel

Swiss PDB Viewer (Guex, 1997). Les RMSD des atomes Cα de chaque superposition de

protéines ont été calculés et comparés pour identifier les structures les plus similaires à

MTH187.

43

CHAPITRE 4. ATTRIBUTION DES SPECTRES RMN ET DÉTERMINATION DE LA STRUCTURE

SECONDAIRE DE MTH187

4.1. Attributions des spectres RMN

4.1.1. Détermination des déplacements chimiques de la chaîne squelettique

En tout premier lieu, nous avons analysé les spectres 15N-TOCSY-HSQC et 15N-

NOESY-HSQC. L’attribution squelettique a débuté aux trois résidus alanines situés en

position 41-43 de la chaîne polypeptidique. Ces résidus ont été choisis car leurs systèmes

de spins sont caractéristiques. La comparaison des corrélations entre ces 2 spectres

permet de trouver les déplacements chimiques des résidus situés à proximité d’un résidu

quelconque, entre autres les résidus de chaque côté de celui-ci. Ces spectres ont permis

d’attribuer plus de 75% de la chaîne squelettique (1HN, 15N et Hα). Un aperçu des

spectres se retrouvent à la Figure 4-1.

N33 E34 D35 W36 R37 I38N33 E34 D35 W36 R37 I38

1HN

1H

N33 E34 D35 W36 R37 I38N33 E34 D35 W36 R37 I38

1HN

1H

Figure 4-1 : Spectres tridimensionnels de MTH187. 3D 15N-TOCSY-HSQC en beige, et 3D 15N-NOESY-HSQC en bleu. F1(1H), F3(1HN) montrés sur différent F2(15N). Les lignes blanches sur un même déplacement chimique en F1 relient les mêmes corrélations.

44

Par la suite, l’obtention de l’échantillon doublement marqué (15N/13C) a permis

d’améliorer les attributions du squelettique à partir des spectres CBCA(CO)NH et

HNCACB (Figure 4-2). Les déplacements chimiques de la chaîne squelettique ont été

complétés, à l’exception de 12 résidus qui n’ont pu être attribués à partir de ces spectres.

Il est à noter que ces résidus sont majoritairement situés au début de la protéine. Ces

spectres ont permis de trouver les déplacements chimiques Cα et Cβ de plusieurs résidus.

N33 E34 D35 W36 R37 I38

1HN

13C

N33 E34 D35 W36 R37 I38

1HN

13C

Figure 4-2 : Spectres tridimensionnels de MTH187. CBCA(CO)NH en beige et HNCACB en bleu. F1(13C), F3(1HN) montrés sur différent F2(15N). Les lignes blanches sur un même déplacement chimique en F1 relient les mêmes corrélations. Le spectre HNCACB montre les corrélations Cα en noire et les Cβ en rouge.

Les spectres HNCO et HN(CA)CO (Figure 4-3) ont été analysés pour compléter les

attributions de la chaîne principale et également pour attribuer les déplacements

chimiques des C΄ de la chaîne squelettique. Après l’analyse de ces spectres, seulement

trois résidus n’ont pu être attribués. La méthionine située au début de la protéine, la

glycine 67 et la phénylalanine 99.

45

G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86

1HN

G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86

1HN

13CO

G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86

1HN

G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86G81 G82 E83 R84 V85 R86

1HN

13CO

Figure 4-3: Spectres tridimensionnels de MTH187. HNCO en beige et HN(CA)CO en bleu. F1(CO), F3(1HN) montrés sur différent F2(15N).

Quelques spectres additionnels ont été acquisitionnés dans le but d’attribuer les

déplacements chimiques des trois résidus non attribués. Le spectre HCA(CO)N a été très

utile pour confirmer certaines attributions déjà identifiées, mais aucune nouvelle

attribution n’a pu être trouvé. Le spectre HN(CO)CA (Figure 4-4), plus sensible que le

spectre CBCA(CO)NH, a cependant permis d’attribuer le déplacement chimique de

l’amide de la phénylalanine 99.

46

Figure 4-4: Plan 2D F1(13C), F3(1HN) du spectre tridimensionnel HN(CO)CA du résidu Phe 99 de la protéine MTH187. Le plan 15N est au déplacement chimique 126,86 ppm.

Le spectre 13C-HSQC a permis de déterminer les déplacements chimiques des

protons α et du Cα de la glycine 67. En effet, en acquisitionnant un 13C-HSQC à très

haute résolution dans la dimension du 13C nous pouvons observer le couplage scalaire C-

C. Sous ces conditions, les glycines apparaissent sous forme de doublet (un seul couplage

C-C) et les autres résidus de la protéine seront sous forme de triplet (deux couplages C-C)

(Figure 4-5). Malgré les attributions de la position α, le groupement NH de la glycine 67

n’a pu être attribué à partir des autres spectres RMN.

8.76 8.84 8.92 9.00

46.1

46.7

47.3

99-98-99

13C

1H

3.0 3.5 4.0

41.8

43.8

45.8

47.8

81

81

96

81

82

20

8296

20

47 47

4747

40

40

Figure 4-5 : Expansion du scorrélations Hα-Cα. Les axe(ppm). Dans ce spectre à hadonnent lieu à des doublets

4.1.2. Attribution dLe spectre 15N-T

de la chaîne latérale. L

et les autres protons à

pas très sensible, surto

loin du NH n’ont sou

HCCH-TOCSY a été n

de déplacements chim

l’aide du spectre CC(C

pu être identifiés. Ces

déplacements chimiqu

figures suivantes, (Figu

pour les trois derniers s

δ ( ppm)

13C

1H

47

pectre 2D 13C-HSQC de MTH187 illustrant la région caractéristique des s montrent les déplacements chimiques (δ) des atomes en partie par millions ute résolution où le couplage scalaire C-C est présent, les Cα des glycines alors que les Cα des autres acides aminés donnent lieu à des triplets.

es déplacements chimiques des chaînes latérales OCSY-HSQC permet de déterminer les déplacements chimiques

e spectre 15N-TOCSY-HSQC donne les corrélations entre un NH

l’intérieur du même système de spins. Cependant, ce spectre n’est

ut pour les résidus dans une hélice-α. En effet, les protons situés

vent pas de corrélation avec celui-ci. C’est pourquoi le spectre

écessaire. Ce spectre a permis de trouver une très grande majorité

iques des protons des chaînes latérales ainsi que des carbones. A

O)NH les déplacements chimiques des carbones non attribués ont

derniers ont pu être retracés dans le spectre HCCH-TOCSY et les

es des protons sur ces carbones ont pu être attribués. Les trois

re 4-6, Figure 4-7, Figure 4-8) nous donne un exemple des plans

pectres cités plus haut où l’on retrouve la leucine 31.

48

2

6.5 6.9 7.37.7

2

4

6

8

HN31-HN31

HN31-Hβ131

HN31-Hβ231

Figure 4-6: Région sélectionnée F1(1H)-F3(1HN) du spectre 15N-TOCSY-HSQC de MTH187 situé à 118.7 ppm sur l’axe F2(15N).Les corrélations observées pour la leucine 31 sont indiquées. Les corrélations entre l’amide et les protons β sont très faibles, et les corrélations avec les protons γ et δ sont absentes dans ce spectre.

0.1 1.1 2.1 3.1

0.5

1.5

2.5

3.5

Hδ1131Hβ231Hδ2131Hβ131Hδ1131Hβ131

Hδ2131Hβ231

Hγ31Hβ231 Hγ31Hβ131

Hα31Hβ131Hα31Hβ231

0.1 1.1 2.1 3.1

0.5

1.5

2.5

3.5

Hδ1131Hβ231Hδ2131Hβ131Hδ1131Hβ131

Hδ2131Hβ231

Hγ31Hβ231 Hγ31Hβ131

Hα31Hβ131Hα31Hβ231

Figure 4-7: Région sélectionnée F1(1H)-F3(1H) du spectre HCCH-TOCSY de MTH187 situé à 40.6 ppm sur l’axe F2(13C). Les corrélations observées pour la leucine 31 sont indiquées. Les corrélations entre les protons β et les protons γ sont très faibles dans ce spectre.

1H

1H

1H

1H

49

HN32-Cα31

HN32-Cβ31

HN32-Cδ131

HN32-Cδ231

C

HN32-Cγ31

HN32-Cα31

HN32-Cβ31

HN32-Cδ131

HN32-Cδ231

C

HN32-Cγ31

13C

1HN

HN32-Cα31

HN32-Cβ31

HN32-Cδ131

HN32-Cδ231

C

HN32-Cγ31

HN32-Cα31

HN32-Cβ31

HN32-Cδ131

HN32-Cδ231

C

HN32-Cγ31

13C

1HN

Figure 4-8: Région sélectionnée F1(13C)-F3(1HN) du spectre CC(CO)NH de MTH187 situé à 108.8 ppm sur l’axe F2(15N). Les corrélations observées pour la leucine 31 sont indiquées. Les corrélations entre l’amide et les Cα, Cβ, Cγ et Cδ sont très bien visibles dans ce spectre.

Dans le cas de l’exemple de la leucine 31, le spectre 15N-TOCSY-HSQC (Figure

4-6) montre les corrélations entre le proton, HN, et les protons Hα, Hβ1, Hβ2 sont

observés, les autres n’étant pas assez intenses. Le spectre HCCH-TOCSY (Figure 4-7)

révèle, à partir du plan 13C correspondant au déplacement chimique du Cβ, les

corrélations intra-résidu avec le Hα, Hβ1, Hβ2 Hγ, Hδ1 et Hδ2. Le spectre CC(CO)NH

donnent des corrélations avec le Cα, Cβ, Cγ et Cδ à partir du HN du résidu 32 (Figure

4-8). La majorité des chaînes latérales des résidus ont été entièrement attribuée avec

l’analyse de ces trois spectres. L’attribution est complétée à 98% sans compter les résidus

aromatiques (annexe).

4.1.3. Détermination des déplacements chimiques des résidus aromatiques

Les attributions des protons et carbones aromatiques ont été majoritairement

obtenues à partir d’un spectre 3D HCCH-COSY et de spectres 2D F3F1-HCCH-COSY

et F3F2-HCCH-COSY. Ces spectres étaient optimisés pour l’observation des aromatiques.

Le spectre 2D F3F2-HCCH-COSY est illustré à la Figure 4-9. Ce dernier a été très utile

pour déterminer les déplacements chimiques caractéristiques de certains noyaux.

11511912312131135

6.2

6.6

7.0

7.4

7.8

8.2

Cδ144-Hδ144

Cε1-His

Cδ136-Hδ136

Cδ1-Hδ1107

Cδ,Cε,Cζ PHE Cε1107,Hε1107

Cδ2-His

Cζ244Hζ244

Cζ247Hζ247

Cζ232Hζ232

Cδ17-Hδ17

11511912312131135

6.2

6.6

7.0

7.4

7.8

8.2

Cδ144-Hδ144

Cε1-His

Cδ136-Hδ136

Cδ1-Hδ1107

Cδ,Cε,Cζ PHE Cε1107,Hε1107

Cδ2-His

Cζ244Hζ244

Cζ247Hζ247

Cζ232Hζ232

Cδ17-Hδ17

Figure 4-9: Spectre 2D HCCH-COsolution 100% D2O. Les corrélatiocarbone voisin et les corrélations n

Les déplacements ch

identifiables, entre autre le C

ppm. Dans la Figure 4-9

apparaissent clairement dans

un déplacement chimique qu

spectre. Plusieurs autres rég

d’attribuer facilement les noy

1H

C137C13

713C

50

SY de MTH187, F3(1H)-F2(13C). La protéine MTH187 est dans une ns positives (noires) correspondent au 13C ayant un nombre impair de égatives (bleu) au 13C ayant un nombre pair de carbone voisin.

imiques de certains noyaux aromatiques sont facilement

ζ2 avec son Hζ2 des résidus tryptophane situés autour de 114

les trois corrélations Cζ2 et Hζ2 des résidus tryptophane

cette région du spectre. Les Cδ1 des tryptophanes figurent à

i varie entre 126 et 128 ppm et sont des pics positifs dans le

ions spectrales mentionnées dans la Figure 4-9 permettrent

aux des résidus aromatiques.

L’analyse du spectre 3D HCCH-COSY a permis d’identifier presque la totalité des

protons et carbones sur les cycles aromatiques. Le déplacement chimique des noyaux Cζ

et Hζ de la phénylalanine 49 n’ont pu être perçu ainsi que les Cζ3 et Hζ3 des trois

tryptophanes de MTH187. La Figure 4-10 montre un plan du spectre 3D HCCH-COSY.

16.36.7 7. 7.5

6.3

6.7

7.1

7.5

Hδ1107-Hε1107

Hε1107- Hδ1107

Hζ236-HH236

HH236- Hζ236

Hδ49-Hε49

Hε49-Hδ49

16.36.7 7. 7.5

6.3

6.7

7.1

7.5

Hδ1107-Hε1107

Hε1107- Hδ1107

Hζ236-HH236

HH236- Hζ236

Hδ49-Hε49

Hε49-Hδ49

Figure 4-10: Plan F1, F3 du spLes pics de la diagonale repréproton Hε du résidu 107. Les sont montré dans cette figure.

4.2. Synthèse de l’

Tous ces spectres o

protéine MTH187 excep

et de la Glycine 67. L’at15N-HSQC est illustré à l

H1

H1

1H

1H

51

ectre 3D HCCH-COSY de MTH187. MTH187 est dans une solution D2O. sentent les corrélations des protons et eux-même. Le proton Hδ corrèle avec le corrélations entre les protons Hζ2 et Hη2 du résidu 36 et Hδ-Hε du résidu 49

attribution

nt permis d’attribuer la chaîne squelettique des 111 résidus de la

tés les déplacements chimiques des HN et N de la Méthionine 1

tribution des chaînes latérales a été complétée à 98%. Le spectre

a (Figure 4-11) avec les attributions.

52

1H 6.5 6.7 6.9 7.1 7.3 7.5 7.7 7.9 8.1 8.3 8.5 8.7 8.9 9.1 9.3 9.5 9.7 9.9 10.1 10.3

104

106

108

110

112

114

116

118

120

122

124

126

128

130

M89S13

V105E25E56N48

N106R70

S76Q79R39

V55F24

E109

A74

L58

L62K91

K102L61

R75

V69E29A87

I38

L31I46

V103

E83 D51

S30

K60I80L108 V85R86M19

S66 F49V54

E22W7

100V8

I45

E90

S17W44 R101

A93A43 L27

E94

A23 A88L28

E4

D21

Q50

R84

S71

R37

E63

Y107 L92 D64R53 L77

G72

A73

G96

D35 N33R9D65

G47

A104A2 A41

E34

A15

T97

H111

S32

E52

G20

T95

W36

T110

G82G40 G81

G98

V12

R18

N5

D3

D11

Q50ε

N5δN48δ

N106δ

W36ε

Q33ε

W44εW7ε

Q79ε

Figure 4-11: : Spectre 2D 15N-HSQC de MTH187. Ce spectre montre les corrélations entre le proton (1H) et son 15N. Les pics reliés représentent les corrélations des deux protons avec leur azote des arginines et des asparagines.

15N

53

4.3. Structure secondaire de MTH187 Les données recueillies lors de l’attribution séquentielle du squelette de MTH187

ont permis de déterminer la structure secondaire de cette protéine. En effet l’utilisation de

l’indice de déplacement chimique (chemical shift index, CSI) (Wishart and Sykes, 1994)

indique que MTH187 possède une structure secondaire formée entièrement d’hélices α

(Figure 4-12).

-1

0

1

10 20 30 40 50 60 70 80 90 100 110

Phe24-Ser30

Asn33 -Trp44

Gly47-Leu61

Phe68-Ile80

Glu83-Ala93Phe99-Glu109

-1

0

1

10 20 30 40 50 60 70 80 90 100 110

Phe24-Ser30

Asn33 -Trp44

Gly47-Leu61

Phe68-Ile80

Glu83-Ala93Phe99-Glu109

Figure 4-12: Graphique montrant le résultat de l’analyse CSI pour la protéine MTH187. Les déplacements chimiques des 1Hα, 13Cα ,13Cβ ont été utilisés. La structure secondaire est résumée dans cette figure. Lorsque y =1, la structure secondaire favorisée est le feuillet β et lorsque y = -1 la structure secondaire favorisée est l’hélice. D’après l’analyse CSI, MTH187 est composée de 6 hélices α: Phe24-Ser30, Asn33-Trp44, Gly47-Leu61, Phe68-Ile80, Glu83-Ala93, Phe99-Glu109. Figure générée à partir du logiciel CSI (Wishart and Sykes, 1994).

L’analyse avec le logiciel TALOS indique également une structure secondaire sous

forme d’hélices α (Figure 4-13). Cependant les limites de ces hélices varient légèrement

comparées à l’analyse de type CSI. La Table 2 fait la comparaison entre les deux

méthodes de détermination de structures secondaires : CSI et TALOS.

54

A)

B)

Figure 4-13 : A) Graphique montrant le résultat du logiciel TALOS pour la protéine MTH187. Les déplacements chimiques des 1Hα , 13Cα ,13Cβ, CO et N ont été utilisés. Les régions vertes représentent les résidus où TALOS suggère une structure secondaire avec un niveau de confiance élevé. Les régions rouges représentent les régions où la structure secondaire est contradictoire (Bad). Les régions jaunes signifient des régions ambiguës et les régions grises correspondent aux régions non classées. L’analyse avec TALOS indique que MTH187 est composée de 6 hélices α: Glu25-Leu31, Arg37-Ile46, Val55-Glu63, Phe68-Ile80, Glu83-Ala93, Ala100-Glu109. B) Graphique de Ramachadran illustrant les angles dièdres du résidu central des dix tripeptides de la banque de données ayant des déplacements chimiques secondaires (secondary shifts) similaire à ceux du tripeptide R75-S76-L77. Cette analyse permet d’estimer les angles dièdres φ/ψ de S76 à –66 ± 9 / -37± 8.

55

Table 2 : Comparaison des méthodes de détermination de structures secondaires de MTH187

La structure secondaire des régions des acides aminés 33 à 63 de MTH187 est

moins bien définies. Les calculs des structures tridimensionnelles tenteront entre autre de

perfectionner ces régions.

CSI Hélices α TALOS Hélices α

24-30 25-31 33-44 37-46 47-61 55-63 68-80 68-80 83-93 83-93

99-109 100-109

56

CHAPITRE 5. STRUCTURE DE MTH187

5.1. Calcul de structures de MTH187

5.1.1. Calculs avec CNS Les contraintes structurales obtenues à partir des données expérimentales ont

permis de calculer la structure tridimensionnelle de MTH187. Plus de 25 lancements de

calculs ont été nécessaires pour obtenir des structures bien définies.

Tout d'abord un premier calcul de structures a été lancé avec les données NOEs

obtenus par l’attribution du spectre 15N-NOESY-HSQC. 670 contraintes NOEs ont été

utilisées pour calculer une famille de 40 structures. Le nombres de violations › 0.1 Å

pour ce calcul était de 321. La superposition de ces structures donne une RMSD de 8 Å

pour le squelette de la protéine. Les structures sont très différentes des unes des autres.

Plusieurs modifications ont été effectuées sur l’attribution du spectre 15N-NOESY-HSQC

car des attributions étaient erronées. Un nouveau calcul de structures a été effectué. Les 9

premières itérations de calculs ont porté entièrement sur des changements dans les

attributions du spectre 15N-NOESY-HSQC. La neuvième itération a été effectuée pour

100 structures avec 1079 contraintes NOEs dont 323 intra-résidus, 772 interactions à

moyennes portées et 34 interactions longues portées. Le nombre de violations de plus de

0.1 Å était de 202.

Le dixième calcul de structures s’est effectué avec les mêmes NOEs qu’au dernier

calcul mais en plus 50 contraintes d’angles phi, obtenues à partir des constantes de

couplage, ont été utilisées. Le nombre de violation de 0.1 Å a chuté à 41 violations.

Quelques modifications ont été faites sur les contraintes NOEs pour obtenir 1011

contraintes NOEs. Également 104 contraintes d’angles dièdres phi et psi sont ajoutées

grâce à l’analyse de TALOS. Les 50 contraintes d’angles phi sont toujours présentes dans

le calcul des 100 structures. À ce stade, la structure de MTH187 commence à montrer

quelques hélices α mais rien de très structurée. On peut compter 110 contraintes violées

dans ces structures.

57

Entre-temps, le spectre 13C-NOESY HSQC a été acquisitionné. Le spectre a été

partiellement attribué. En effet seulement 501 corrélations ont été identifiées dans ce

spectre. Ces attributions sont appuyées sur un script écrit par le docteur Gagné qui

détermine les corrélations symétriques dans le spectre et suggère différentes attributions.

5.1.2. Calcul avec ARIA/CNS Afin d’accélérer le processus de raffinement des structures, des structures ont été

calculées utilisant le logiciel ARIA. Dans chacun des calculs suivants 100 structures ont

été calculées. Au cours du 12ième lancement de calculs, les contraintes structurales

utilisées étaient les contraintes NOEs des spectres 15N-NOESY-HSQC et 13C-NOESY-

HSQC, les angles phi et psi obtenus avec TALOS et les constantes de couplage. Lors de

la calibration des NOEs, ARIA utilise UN temps de corrélation. Le temps de corrélation

utilisé à ce moment était estimé à 4.32 ns. sur la base du poids moléculaire de MTH187

lorsque la protéine est dans l'eau (15N-NOESY HSQC) et de 5.4 ns. dans le D2O (13C-

NOESY-HSQC). Ces temps de corrélation ont été utilisés jusqu'au dix-neuvième calcul

de structures avec ARIA. Au cours de ces calculs, grâce à l’analyse des violations,

plusieurs attributions ont été enlevées ou ajoutées. Également quelques angles dièdres ont

été modifiés. À partir du dix-huitième calcul de structures des contraintes de ponts

hydrogène ont été utilisées. À partir de cette itération, nous avons utilisé un temps de

corrélation déterminé expérimentalement par l’analyse des données de relaxation

(annexe) soit de 7.3 ns. dans l'eau et de 8.1 ns. dans le D2O.

La calibration des NOEs a été effectuée entièrement avec Aria jusqu'au dix-

huitième calcul de structure inclusivement. Par la suite, tout en modifiant certaines

contraintes, les autres calculs ont permis de comparer la calibration des NOEs obtenus

dans le spectre 15N-NOESY-HSQC effectuée avec Aria et avec la nouvelle méthode de

calibration conçu par Etienne Enoumen. Au cours des calculs, cette dernière méthode de

calibration a été perfectionnée et est devenue la méthode de choix pour la calibration des

NOEs dans le spectre 15N-NOESY-HSQC.

58

5.1.3. Structures finales de MTH187 Le 32ième calcul de structures a été basé sur 3087 contraintes NOEs, 94 contraintes

d’angles dièdres obtenus avec les constantes de couplage, 142 contraintes d’angles

dièdres obtenus avec TALOS et 9 contraintes de ponts hydrogène.

Les calculs complétés, l’attribution à la huitième itération de ARIA contient 1607

NOEs non ambiguës dont 318 dans le spectre 15N-NOESY-HSQC et 1246 NOEs dans le

spectre 13C-NOESY-HSQC. Des 1607 NOEs, 616 NOEs sont intra-résiduels, 219

séquentiels, 254 NOEs entre les protons situés à une distance moyenne et 518 sont à

longue distance. Certains NOEs sont classés comme étant ambiguës: 88 NOEs intra-

résiduels, 135 séquentiels, 170 à des distances moyennes et 349 à de longues distances.

L’énergie globale des 30 structures des 72 structures calculées varie entre 737 et 843

Kcal/mol. Les dix-huit dernières structures possèdent des énergies très élevées de l’ordre

de 1900 à 8587 Kcal/mol.

Les 30 structures de plus basses énergies ont subi une simulation dans l’eau par

ARIA. Ces structures sont considérées comme étant les structures finales de MTH187.

Celles-ci sont montrées à la Figure 5-1. Les RMSD de la superposition des 30 structures

finales sont résumées à la Table 3.

Figure 5-1 : Superposition de 30 structures de MTH187. 32ième lancement de calculs effectués par ARIA. La RMSD est de 0.66 Å pour la chaîne squelettique (résidus 24-109) et de 1.23 Å pour les atomes lourds entre les résidus 24 à 109 de la protéine.

59

Table 3 : Table des RMSD de la structure finale de MTH187

RMSD Chaîne squelettique

(Å) RMSD pour tous les atomes

lourds (Å) résidu 1-111 2.47 ± 0.67 2.98 ± 0.68 résidu 24-109 0.66 ± 0.1 1.23 ± 0.14

La structure de MTH187 possède trois paires d’hélices α. Les résidus sont placés de

sorte que ceux qui sont hydrophobes se retrouvent au centre de la protéine pour éviter

tout contact avec l’eau et les résidus hydrophiles se retrouvent vers l’extérieur (une étude

plus approfondie sera entreprise sur le sujet). Les résidus dans la région N-terminale, de 1

à 24, ne sont pas structurés. La Figure 5-2 illustre mieux les hélices α de la protéine

MTH187. Cette structure (Figure 5-2) possède l’énergie la plus basse des structures

simulées dans l’eau.

Figure 5-2 : Structure de MTH187 (haut : Vue en stéréo, bas : rotation de 90° de long de l’axe des X. Les calculs de structures tridimensionnelles ont été faits par ARIA et les structures ont été visualisées dans MOLMOL. Les six hélices α sont représentées. La structure montrée est la structure calculée dans l’eau où l’énergie est la plus basse parmi les 72 structures calculées.

60

5.1.4. Qualité des structures Afin de vérifier la qualité stéréochimique des structures de MTH187 satisfaisant les

contraintes structurales, le logiciel PROCHECK a été utilisé pour évaluer la géométrie

des résidus par rapport aux paramètres stéréochimiques dérivés des structures bien

structurées dans une banque de données (Laskowski, 1993). Les 30 structures de

MTH187 simulées dans l’eau ont été testées. Le tout est illustré à la Figure 5-3 et Figure

5-4.

Figure 5-3 : Graphique de Ramachandran des 30 structures RMN des résidus 24-109 de MTH187. Les résidus Glycine sont représentés par des triangles. Les régions favorisées par les angles phi et psi sont les deux régions les plus foncées. Les régions moins permises mais acceptables sont d’une couleur grise intermédiaire et les régions non permises sont en gris très pâle. Le % des résidus situés dans les régions favorisées est de 90.7%.

Figure 5-4 : (montrée dans les six pages suivantes) Graphique de Ramachandran des résidus 2 à 110 de la structure RMN de MTH187. Chaque point dans chaque graphique de Ramachandran représente les 30 structures générées. Chaque graphique de Ramachandran indique la conformation du squelette pour un résidu, et ce pour chacune des structures calculées. Les structures secondaires définies manuellement sur cette figure sont : hélice 1 (22-31), hélice 2 (36-49), hélice 3 (55-64), hélice 4 (68-80), hélice 5 (83-94), hélice 6 (100-109).

61

Figure 5-4 (partie 1 de 6)

-120

-60

0

60

120

1

2

3

45

6

7

8

9

10

11

12

13

14

15 16

17

18

19

20

21

22 23

24

25

26

27

28

29

30

ALA 2

1

23

4

56

7

8

9

10

11

12

13

1415

16

17

1819

20

21

22

23

24

2526

27

28

29

30

ASP 3

1

2

34

5

6

7

8

910

11

12

13

1415 1617

18

19

20

212223 24

25

26

27

28

2930

GLU 4

1

2

34

5

67

89

10

11

12

13

1415

1617

18

19

20

21

222324

25

2627

28

2930

ASN 5

-120

-60

0

60

120

1

2

3

45

678

9

10

11

1213

141516

17

18

19

20

21

22 23

24

25 26

27

28

2930

LYS 6

1

23

4

5

67

8

9

1011

12

13

1415

16

17

18

19

20

21

2223

24

2526

27

28

29

30

TRP 7

1

2 34

5

67

8

9

10

11

12

13

1415

1617

18

19

20

21

22

2324

25

26

27

28

29

30

VAL 8

1

2

34

56

78

910

11

12

13

14

15

16

17

18

19

20

21

22

23

2425262728

2930

ARG 9

-120

-60

0

60

120 1234 5678 91011121314

15161718

192021 2223

2425

26

2728

29

30

ARG 10

1

2

3456

78

910

11

12

13

14

15

16

1718

19

202122

23

24

2526

27

28

2930

ASP 11 1

2

3

4

5

6

7

8

91011

12

13

14

15

16

17

1819

2021

22

23

24

25

2627

28

29

30

VAL 12

1

2

3

4

5 67

8

9

10

11

12

1314 15

1617

18

19

20

21

22

2324

25

26

27

2829

30

SER 13

-120

-60

0

60

120 12

3

45

67

8910

11

12

13

14

15

16

17

1819

20

21

22 23

24

25

26

27

28

29

30

THR 14

1 23

456

7

891011

1213

14

151617

18 19

20

21

22

23

24

25 2627

28 29

30

ALA 15

12

3

45

6

789 1011

12

13

1415

1617

18

1920

21

22

2324

25

2627

28

29

30

LEU 16

123456 78 910

11 1213

141516

171819

20

212223

24

25 26

27

282930

SER 17

-180-120 -60 0 60 120 -180

-120

-60

0

60

1201

2

345 67

8

9

10

1112

1314

15

1617

18

19

20

21

22 23

24

2526

27

2829

30

ARG 18

-180-120 -60 0 60 120

1 2

3

4

567

89

1011

12

1314 15

16

17 1819

20

21

22

23 2425

26

27

28

29

30

MET 19

-180-120 -60 0 60 120

1

2

3

45

6789

10

11

12

13

14

15

16

17

18 19

20

21

22

23

24

25

26

2728

29

30

GLY 20

-180-120 -60 0 60 120 180

1 23

45

6

789

1011

12

13 1415 1617 181920 212223

2425

26

2728

2930

ASP 21

Phi (degrees)

Psi (

degr

ees)

62

Figure 5-4 (partie 2 de 6)

-120

-60

0

60

120

12

3

4

5

678910

11

12131415

1617

18

1920212223

24252627282930

GLU 22

12

3

4

5

678910

11

12

13141516

1718

19202122 23

24

25

2627282930

ALA 23

1234567891011121314151617181920212223

24252627282930

PHE 24

123456789101112131415161718192021222324252627282930

GLU 25

-120

-60

0

60

120

123456789101112

1314

15161718192021222324252627282930

PRO 26

12345678910

1112

131415161718

192021222324252627282930

LEU 27

12345678910111213

1415161718192021

2223242526272829

30

LEU 28

123

456789

10111213141516

1718192021

2223242526272829

30

GLU 29

-120

-60

0

60

120

123

456789

10

1112131415161718192021222324252627282930

SER 30

1234567

89

10111213141516171819202122

2324252627282930

LEU 31

1

2345678910

111213

14

15

16

17181920212223

24

25

2627282930

SER 32

1

234 56 78

9

10

11

12

131415

1617

1819202122

23

2425 26

27

28

29

30

ASN 33

-120

-60

0

60

120

12345678

9101112 13141516171819202122

23

242526

2728

29

30

GLU 34

123456789101112131415161718

19

2021222324

25

2627282930

ASP 35

1234

567

8

91011121314

151617181920

2122232425

26

2728

2930

TRP 36

12

345678910

11121314151617181920

21

222324252627282930

ARG 37

-180-120 -60 0 60 120 -180

-120

-60

0

60

120

1234567891011

1213 141516

1718192021 222324252627 282930

ILE 38

-180-120 -60 0 60 120

1234567891011121314151617181920212223242526272829

30

ARG 39

-180-120 -60 0 60 120

123456789101112131415161718192021222324252627282930

GLY 40

-180-120 -60 0 60 120 180

123456789101112131415161718192021222324252627282930

ALA 41

Phi (degrees)

Psi (

degr

ees)

63

Figure 5-4 (partie 3 de 6)

-120

-60

0

60

120

123456789101112131415161718192021222324252627282930

ALA 42

123456789101112131415161718192021222324252627282930

ALA 43

123456789101112131415161718192021222324252627282930

TRP 44

123456789101112131415

1617

18192021222324252627282930

ILE 45

-120

-60

0

60

120

123456789101112131415161718192021222324252627282930

ILE 46

123456789

1011121314

15161718192021222324252627282930

GLY 47

123456789101112131415161718192021222324252627282930

ASN 48

1234 5678910111213

141516

17

18192021222324252627282930

PHE 49

-120

-60

0

60

120

1234567891011

1213141516

17

18192021222324252627282930

GLN 50

1

2 34567891011

12

13

1415

1617 1819202122232425

2627282930

ASP 51

1

234567891011

12 131415

161718192021222324252627282930

GLU 52

123456789101112

131415

161718192021222324252627282930

ARG 53

-120

-60

0

60

12012 34567 891011

12131415

1617 18192021

2223242526

27282930

ALA 54

123456789101112131415

161718192021222324252627282930

VAL 55

123456789101112131415161718192021222324252627282930

GLU 56

123

4567891011121314151617

1819

20212223242526

27

282930

PRO 57

-180-120 -60 0 60 120 -180

-120

-60

0

60

120

123456789

101112131415

16171819 20212223242526

27 282930

LEU 58

-180-120 -60 0 60 120

12345678910111213

1415161718192021222324252627282930

ILE 59

-180-120 -60 0 60 120

12345678

910

11

1213

1415161718192021222324252627282930

LYS 60

-180-120 -60 0 60 120 180

1234

56

7891011121314

151617181920212223

24252627282930

LEU 61

Phi (degrees)

Psi (

degr

ees)

64

Figure 5-4 (partie 4 de 6)

-120

-60

0

60

120

1234

5

67891011

121314151617181920212223242526272829

30

LEU 62

123456

78

9101112

131415161718192021222324252627282930

GLU 63

1234

5

6789101112131415161718192021222324252627282930

ASP 64

12

3

4

5

6789

101112131415161718

192021

22

232425

262728

2930

ASP 65

-120

-60

0

60

120

12345

6

789101112131415161718

19

20

21

22

23

24

252627282930

SER 66

123

456

789101112131415161718 1920 21222324

252627282930

GLY 67

12345678 9101112131415161718192021222324252627282930

PHE 68

123456789101112131415161718192021222324252627282930

VAL 69

-120

-60

0

60

120

12345678910111213141516171819202122232425262728

2930

ARG 70

123456789101112131415161718192021222324252627282930

SER 71

123456789101112131415161718192021222324252627282930

GLY 72

123456789101112

131415161718

19202122232425262728

2930

ALA 73

-120

-60

0

60

120

123456789101112131415161718192021222324252627282930

ALA 74

123456789101112

1314151617181920

2122232425262728

2930

ARG 75

123456789101112

131415161718192021222324252627282930

SER 76

123456789

101112131415161718192021222324

252627282930

LEU 77

-180-120 -60 0 60 120 -180

-120

-60

0

60

120

1234567891011

1213

1415161718192021222324252627282930

GLU 78

-180-120 -60 0 60 120

123456789101112131415161718192021222324252627282930

GLN 79

-180-120 -60 0 60 120

1 2345 6789101112

1314151617 1819202122 2324 2526

2728

2930

ILE 80

-180-120 -60 0 60 120 18012

3

4

5

6789

10

1112 13

14

15

161718

19

20

21

22

23

24

25

262728

29

30

GLY 81

Phi (degrees)

Psi (

degr

ees)

65

Figure 5-4 (partie 5 de 6)

-120

-60

0

60

120

12

34

5

6789

10

11

12

13

14

15

16

17

1819

20

21

22

23

24

25

26

272829

30

GLY 82

123456789101112131415161718192021222324

252627282930

GLU 83

123

4

5 67891011121314

15161718192021 22

2324

2526272829

30

ARG 84

12345678910

111213141516171819

20212223

24252627282930

VAL 85

-120

-60

0

60

120

1234567

891011

1213

1415161718192021

222324

252627282930

ARG 86

123456 78 9101112 13

14151617181920212223242526272829 30

ALA 87

123456789

101112131415161718192021222324252627282930

ALA 88

123456789101112131415161718192021222324252627282930

MET 89

-120

-60

0

60

120

12345678910111213

141516171819202122232425

2627282930

GLU 90

123456 789101112131415

161718192021222324

252627

282930

LYS 91

1 23456

7891011

121314

15161718192021222324252627

282930

LEU 92

123

45678

9101112131415

1617

181920212223

242526

27

282930

ALA 93

-120

-60

0

60

120

12345678

9101112131415

161718192021222324252627282930

GLU 94

123

45678

9101112

13

14

15

16

1718 19

20 2122

23

2425

26

2728

29

30

THR 95

12

3

456

7

8

91011

1213

14

15

16

17

18

19

202122

23

24

25

26

27

28

29

30

GLY 96

12

3

4

5

67

8

9

1011

1213

1415

16 17

18

192021

22

232425

262728

2930

THR 97

-180-120 -60 0 60 120 -180

-120

-60

0

60

120

1

2

3

4

5

67

8

9

1011

12

13

14

15

16

17

18

19

20

21

2223

242526

2728

29

30

GLY 98

-180-120 -60 0 60 120

12

345

67

891011

1213

14

1516

17 18

19202122232425

2627282930

PHE 99

-180-120 -60 0 60 120

123456789101112131415161718192021222324252627282930

ALA 100

-180-120 -60 0 60 120 180

1234 5678910

111213141516

171819

2021

2223

242526

27282930

ARG 101

Phi (degrees)

Psi (

degr

ees)

66

Figure 5-4 (partie 6 de 6)

Pour chaque résidu de MTH187, plusieurs statistiques peuvent être émises. La

Table 4 donne une moyenne de certaines données lors du calcul de structures de

MTH187.

-120

-60

0

60

120

123456789101112131415161718

192021222324252627282930

LYS 102

12345678910111213141516171819202122232425 2627282930

VAL 103

123456789101112131415161718192021222324252627282930

ALA 104

12345678910111213

1415161718192021222324252627282930

VAL 105

-120

-60

0

60

120

123456789101112131415161718192021222324252627282930

ASN 106

123

456

7

89101112131415161718192021222324252627282930

TYR 107

-180-120 -60 0 60 120

1234567

8910111213141516171819202122232425262728

2930

LEU 108

-180-120 -60 0 60 120 180

12345

67

8910

111213141516171819202122

23

24

252627

282930

GLU 109

-180-120 -60 0 60 120 -180

-120

-60

0

60

120

12

3

4

5

67

89

1011

1213141516171819

20212223

24

25262728

2930

THR 110

Phi (degrees)

Psi (

degr

ees)

67

Table 4 : Statistiques structurales des structures RMN de MTH187 a

RMSD des contraintes structurales a

NOES 0.02 ± 0.0005

angles dièdres 0.619 ± 0.287 constante de couplage 0.723 ± 0.086

Énergies Kcal mol-1

E VDW -308.21 ± 4.2 E Bonds 26.685 ± 0.7 E cdih 4.5 ± 0.5

E TOTALES -3697.675 ± 94.277 E NOE 61.597 ± 3.719

chaîne squelettique Tous les atomes

RMSD atomique b

toute la protéine 2.47 ± 0.67 2.98 ± 0.68 résidus 24-109 0.66 ± 0.1 1.23 ± 0.14

région favorisée (%) c 90.70%

résidus situés dans régions permises 8.60% résidus situés dans régions non permises 0.60% a Les contraintes structurales et les énergies sont basées sur la moyenne des 10 premières structures du 32ième calcul. b RMSD (root mean square deviations) signifie la moyenne de la déviation de chacun des atomes par rapport aux structures. c Pourcentage des résidus 24 à 109 des 30 structures qui sont situés dans les régions les plus favorisées du graphique de Ramanchandran déterminés par le logiciel PROCHECK.

La région en N-terminale (résidus 1-21) est non structurée. Les angles phi et psi des

30 structures générées ne se concentrent pas dans une région donnée. Par contre pour les

régions formant les hélices α, les angles phi et psi sont presque tous situés à la même

position pour un résidu donné. Cela confère de belles hélices bien structurées. Les angles

de certains résidus pourraient être étudiés, en particulier la phénylalanine 99 où l’on

retrouve des angles Φ positifs. Également l’acide aspartique 65 et la glutamine 50 où les

angles Φ sont situés dans des régions plus ou moins permises. Malgré ces aspects

négatifs, la RMSD des 30 structures superposées est très satisfaisante. La structure en

générale de MTH187 est de bonne qualité

CHAPITRE 6. HOMOLOGIE STRUCTURALE

La structure de MTH187 a été utilisée afin d'identifier des homologues structuraux.

Les coordonnées de la protéine ont été soumises à un programme de recherche

d'homologues structuraux. Le programme utilisé ici se nomme DALI (distance matrix

alignment)(Holm and Sander, 1996). Le serveur DALI est un service automatique pour la

comparaison de structures en trois dimensions. Les coordonnées d'atomes ont été

soumises à DALI et nous avons obtenu les structures les plus semblables à la structure

soumise. Celles-ci sont énumérées dans le tableau suivant.

Table 5: Protéines identifiées par DALI comme étant structuralement homologues à MTH187

s

A

G

o

M

PDB ID RMSD (Å) nom de la protéine 1l5j-A 2.4 Aconitase B 3bct 5.6 β -Catenin fragment 1gw5-B 2.9 Adaptor-Related Protein Complex 1ee4-A 3.1 Karyopherin (Importin) α fragment 1bk5-A 2.7 Karyopherin α fragment 1b89-A 3.1 Clathrin Heavy Chain fragment 1hs6-A 3.2 Leukotriene A-4 Hydrolase 1qgr-A 2.8 Importin β Subunit 1dvp-A 2.8 Hepatocyte Growth Factor-Regulated Tyrosine Kinase Substrate 1bd8 2.6 P19Ink4D Cdk4/6 Inhibitor 1b3u-A 2.7 Protein Phosphatase Pp2A fragment 1qbk-B 2.6 Karyopherin β 2 fragment 1bpo-A 3.6 Clathrin Heavy-Chain Terminal Domain * La lettre après le PDB-ID est le nom de la chaîne. Le RMSD a été évalué entre les résidus 24 à 109 de MTH187 et la région homologue le l’autre protéine.

68

Dans le but de vérifier si d’autres protéines, ignorées par DALI, peuvent être

imilaires à la structure de MTH187, le logiciel CE (Shindyalov, 1998) a été utilisé.

ucune autre protéine n’a été rajoutée à la liste de protéine présentée à la Table 5.

énéralement, les mêmes protéines sont retrouvées entre DALI et CE, mais dans un

rdre différent.

Les protéines homologues ont été examinées une à une et superposées avec

TH187 à l’aide du logiciel SPDBviewer (recherche du domaine le plus semblable

69

automatiquement, vérification de la véracité de l’automatisation et obtention de la

meilleure superposition possible par alignement manuel). La superposition obtenue

manuellement est la même que celle obtenue avec DALI. La Figure 6-1 montre la région

séquentielle 63 à 151 de la protéine Aconitase B (1L5J) superposée avec la région 24 à

109 de MTH187.

pdb1l5j. 63 VKAGFLAAIA KGEAKSPLLT PEKAIELLGT MQGGYNIHPL IDALDDAK-- aria_19w 24 FEPLLESL SNEDW---RI RGAAAWIIGN FQDERAVEPL IKLLEDDSGF * * * ..* * . ** * *.* pdb1l5j. 111 LAPIAAKALS HTLLMFDNFY DVEEKAKAGN -EYAKQVMQSW AD aria_19w 69 VRSGAARSLE QIG-GERVRA AMEKLAETGT GFARKVAVNYL E . . **..* . * * .* * .

Figure 6-1 :Alignement des régions superposées entre l’Aconitase B (pdb ID 1l5j) et MTH187 obtenu par le programme DALI. L’identité entre les deux séquences pour les résidus 24-109 est de 21% et la similarité est de 35%. Les “ * ’’ signifient que les deux résidus alignés sont identiques. Les “.’’ signifient que les deux résidus sont semblables.

La superposition des structures de l’Aconitase B et de MTH187 sont illustrées à la

Figure 6-2. La RMSD (root mean square deviation) des régions semblables est présentée

dans la Table 6, une fois la meilleure superposition entre les deux structures obtenues.

Figure 6-2: Vue en stéréo de la superposition de MTH187 en bleu et de l’aconitase B (I.D.:1L5J) en rouge. Le logiciel utilisé pour visualiser est PYMOL. Le RMSD squelettique des résidus superposés est de 2.36Å.

Table 6: Superposition des régions de MTH187 avec Aconitase B

La

(Figure 6

l’Aconitas

de MTH1

à ces extré

MT

essais ont

semble y

De plus, l

selon DAL

La

Core’’ (1

alignemen

Figure 6-3: deux séquendeux résidu

MTH187 1L5J RMSD (Å)

F24-E34 A65-E75 3.07

R37-S66 L81-K110 1.95

V69-G81 L111-L123 1.43

G82-T97 M125-N140 2.78

VF99-E109 E141-A151 2.77

RMSD pour les résidus squelettiques de la région superposée est de 2.36Å

-2). Les six hélices α de MTH187 correspondent bien avec les hélices de

e B pour une RMSD de 2.27 Å. Comme on peut le constater, la région centrale

87 (les hélices 2, 3, et 4) est très bien superposée à l’aconitase comparativement

mités.

H187 a également été superposée avec la protéine β-Catenin (3bct). Plusieurs

été effectués, mais à l’endroit où MTH187 pourrait se superposer le mieux, il

avoir une coupure dans la chaîne entre les résidus 549 et 563 de la β-Catenin.

a superposition laissait à désirer d’après sa RMSD beaucoup trop haut (5.6 Å

I) Donc, l’analyse ne s’est pas poursuivie plus loin.

troisième superposition s’est faite avec la protéine “Ap2 Clathrin Adaptor

GW5). Selon Dali, la RMSD de la chaîne squelettique est de 2.9 Å. Un

t manuel a permis de mieux superposer les deux protéines (Figure 6-3).

MTH187 24 FEPLLESL S-NEDWRIRG AAAWIIGNFQ DE--RAVEPL IKLLEDDSGF pdb1gw5. 428 IIATLCENL DSLDEPDARA AMIWIVGEYA ERIDNADELL ESFLEGFHDE . * *.* .. *. * **.*.. . * * * .** MTH187 69 ---VRSGAAR SLEQIGGERV RAAMEKLAET GTGFARKVAV NYLE pdb1gw5. 477 STQVQLTLLT AIVKLFLKK- ---------- ----PSETQE LVQQVLS *. .. . . . .

70

Alignement des régions superposées entre AP2 (pdb1gw5) et MTH187. L’identité entre les ces pour les résidus 24-109 est de 21% et la similarité est de 42%. Les “ * ’’ signifient que les

s alignés sont identiques. Les “.’’ signifient que les deux résidus sont semblables.

71

Figure 6-4: Vue en stéréo de la superposition de MTH187 en bleu et de l’adapteur Ap2 (I.D.:1GW5) en rouge. Le logiciel utilisé pour la visualisation est MOLMOL. La RMSD de la chaîne squelettique de la région 24-109 de MTH187 et l’adapteur Ap2 est de 2.72Å.

Comme montré à la Figure 6-4, seulement quatre des six hélices de MTH187 se

superposent adéquatement. Malgré les nombreux essais, les deux dernières hélices de

MTH187 ne se superposent pas avec l’adapteur Ap2, sans perdre la superposition des

quatre premières.

La superposition de MTH187 a été tentée avec toutes les autres protéines issues de

la recherche avec DALI (Table 5). La structure se rapprochant le plus à la structure de

MTH187 reste celle de l’Aconitase B.

La région de l’Aconitase B qui a été superposée, plus particulièrement la région N-

terminal (1-160) de celle-ci, ressemble fortement à la famille structurale des “Heat

repeat’’(Huntingtin-Elongation-A subunit-TOR)(Williams et al., 2002). Cette famille est

caractérisée par une répétition de repliements de 3 à 36 paires d’hélices α antiparallèles

formant des supers-hélices appelés “HEAT’’. Les protéines possédant cette forme de

structures ont une fonction commune de reconnaissance protéine-protéine dans plusieurs

procédés cellulaires (Andrade et al., 2001). Les deux figures qui suivent montre la

structure de l’Aconitase B.

72

Figure 6-5: Structure tridimensionnelle de l’Aconitase B qui a tendance à former des dimères. Le jaune représente le motif de répétition qui ressemble au motif strcutral “Heat repeat’’. Le PDB ID de cette protéine est 1l5j-A.

Figure 6-6: Structure tridimensionnelle de l’Aconitase B sous forme monomérique. La région en jaune représente la région ou la protéine MTH187 se superpose. Le PDB ID de cette protéine est 1l5j-A.

Une autre famille de supers-hélices sont les “Armadillo repeat’’. Ces protéines ont

également une implication dans les interactions protéine-protéine (Andrade et al., 2001).

En analysant le contenu de cette famille, plusieurs protéines se retrouvant dans la liste des

protéines similaires à MTH187 donnée par DALI (Table 5), font parties de cette famille

des "Armadillo repeat''. En guise d’exemple, la protéine β-Catenin identifiée dans la

banque de donnée Protein Data Bank (PDB) par 3bct (Huber et al., 1997). Également ces

autres protéines, inscrites dans la Table 5, ont ce même motif: la karyopherin (1bk5) et

son fragment α (1ee4a), les fragments de chaîne de la clathrin (clathrin heavy chain

fragment)(1b89-A) et la sous-unité β de l’importin (1qgr).

73

CHAPITRE 7. DISCUSSION

Grâce aux travaux présentés dans ce mémoire, il a été possible de déterminer la

structure tridimensionnelle d’une des nombreuses protéines de la bactérie

Methanobacterium thermoautotrophicum et de classer celle-ci dans une famille de

structure.

7.1. Attribution des déplacements chimiques de MTH187 L’attribution des déplacements chimiques de la protéine s’est déroulée relativement

bien. Il aurait été cependant plus facile de débuter par l’attribution des spectres

CBCA(CO)NH et HNCACB car ces spectres sont plus sensibles, moins encombrés et les

systèmes de spin des carbones Cα et Cβ sont plus caractéristiques que les spins des

résidus dans les spectres 15N-TOCSY-HSQC et 15N-NOESY-HSQC. Le spectre HNCO

est également un spectre très sensible. D’ailleurs, les corrélations de tous les carbonyles

sont présents dans ce spectre; même le carbonyle de la glycine 67 dont le groupement

NH est le seul à ne pas avoir été attribué. Le NH de la Méthionine 1 manque également

dans l’attribution, mais les résidus situés en début de chaîne sont souvent difficiles à

attribués car le NH interagit avec le solvant.

En amont de la Méthionine 1 de MTH187 se trouve une chaîne de 20 résidus

correspondant au tag de poly-histidines. Plusieurs résidus de ce segment sont perceptibles

dans les spectres, en autre le CBCA(CO)NH, HCA(CO)N et le HNCO. Des erreurs se

sont souvent glissées dans l’attribution des déplacements chimiques dues à des

corrélations entre les résidus du vecteur. Les déplacements chimiques de ces résidus

interféraient avec l’attribution des corrélations des résidus de la protéine. Ceci a contribué

énormément à augmenter le temps d’analyse des spectres. Pour ma part, il aurait été

préférable de couper ce segment après la purification en procédant à une digestion

enzymatique à l’aide de la trombine. Cette étape aurait engendré par contre de purifier à

nouveau la protéine et donc de diminuer le rendement de celle-ci.

74

Les spectres choisis pour l’attribution des chaînes latérales ont tous été essentiels

pour connaître les déplacements chimiques des différents atomes de la protéine. En

évaluant l’attribution des résidus, nous pouvons constater que quelques déplacements

chimiques des résidus arginines à partir des Nε n’ont pas été complétés. Ces

déplacements chimiques auraient pu être déterminés à l’aide des deux premiers spectres

acquisisionnés soit le 15N-TOCSY-HSQC et 15N-NOESY-HSQC mais les corrélations

entre ces protons et les atomes à proximité se faisaient rare.

7.2. Structure de MTH187 Le nombre de structures tridimensionnelles calculées influencent la RMSD des

structures. Calculer un plus grand nombre de structures donne de meilleures statistiques.

Un calcul de 25 structures avait été entrepris par ARIA et seulement dix d’entre elles

étaient simulées dans l’eau. LA RMSD était très bonne mais moins significative. C’est

pourquoi, un plus grand nombre de structures a été calculées par la suite. 72 structures

dont 30 structures calculées dans l’eau permettent d’avoir une meilleure idée de la famille

de structures de MTH187 (Figure 5-1).

La structure de MTH187 est composée de six hélices α. Lors du calcul des

structures secondaires de MTH187 selon les déplacements chimiques avec le logiciel CSI

et TALOS, une légère contradiction est survenue quant aux régions des hélices α. Le

logiciel CSI suggère des hélices α des résidus 33 à 44 et des résidus 47 à 61. Les hélices α

sont préférées des résidus 37 à 46 et 55 à 63 lors de l’analyse des déplacements

chimiques avec le logiciel TALOS. La structure tridimensionnelle a permis d’évaluer la

performance de l’approche CSI et TALOS à évaluer la structure secondaire. La structure

tridimensionnelle de MTH187 contient entre autre des hélices dans les régions 36 à 49 et

55 à 64 (Figure 5-4). Les régions sous forme d’hélices α dans la structure tertiaire sont

davantage comme l’avait prédit TALOS. Dans notre cas l’approche de TALOS a été

supérieur à CSI. Peut-être que pour d’autres protéines l’approche de CSI serait de

meilleure qualité. Pour les deux approches, l’attribution de la structure secondaire à partir

des déplacements chimiques de MTH187 a été très précise. Les hélices dans la structure

tertiaire sont en générale toutes au même endroit.

75

La distribution des angles dièdres phi et psi dans le graphique de Ramachandran

(90.7% dans les régions les plus favorisées définies par le logiciel Procheck) montre la

géométrie favorable des structures de MTH187. Les résidus qui posent potentiellement

un problème sont principalement la glutamine 50, l’acide aspartique 65 et la

phénylalanine 99. Les angles phi de ces résidus sont dans des régions positives. Des

angles phi dans cette région sont très rares puisque qu’il pourrait y avoir des

encombrements stériques. Par contre ces résidus sont situés dans des boucles très courtes

entre deux hélices. Il peut donc être possible que les deux hélices empêchent tout

mouvement dans la boucle. Ces données au niveau de la structure de MTH187 doivent

être vérifiées. D’autres calculs de structures seront générés afin de perfectionner

davantage la structure de MTH187.

Des contraintes structurales pourraient être modifiées afin d’obtenir un plus grand

nombre de structures superposées et une meilleure superposition de ces structures. Les

angles dièdres obtenus à l’aide de TALOS sont des données théoriques c’est-à-dire que

les déplacements chimiques des peptides sont comparés à d’autres afin de connaître les

angles Φ et ψ. De leur coté, les constantes de couplage sont des données expérimentales

qui sont prises directement dans le spectre HNHA. Ces contraintes peuvent parfois ne pas

être en accord l’une envers l’autre pour un résidu donné. Pour ma part, lorsqu’un cas

comme celui-ci survient, il serait logique d’éliminer ces contraintes d’angles dièdres afin

que le calcul de structures soit repris seulement avec les contraintes de constantes de

couplages.

Malgré l’amélioration de la structure qui peut-être fait, nous pouvons interpréter

que la protéine MTH187 contient six hélices dont trois parallèles d’un coté et trois

parallèles de l’autre. Les résidus sont placés de sorte que ceux qui sont hydrophobes se

retrouvent au centre de la protéine pour éviter tout contact avec l’eau et les résidus

hydrophiles se retrouvent vers l’extérieur. Les résidus dans la région N-terminale, de 1 à

24, ne sont pas structurés mais peut-être est-ce dû au segment his-tag en amont de celle-ci

qui empêche la région de se repliée.

76

La protéine MTH187 a tendance à dimériser. La structure de MTH187,

particulièrement la région N-terminale, peut être structurée différemment lorsqu’elle est

sous forme de dimère. Des études RMN de la protéine sous cette conformation seraient

intéressantes afin de vérifier cette dernière hypothèse et également de regarder les

interactions entre les deux dimères.

7.3. Homologie structurale La structure de MTH187 a été comparée avec des milliers de structures de protéines

dans les banques de données. Peu importe le logiciel utilisé pour la comparaison, les

mêmes protéines y ressortent mais peuvent être dans un ordre différent. En comparant

l’alignement des régions superposées entre l’Aconitase B (pdb ID 1l5j) et MTH187 et

entre AP2 (pdb1gw5) et MTH187, nous pouvons remarquer que le pourcentage d’identité

entre les deux groupes de séquences est de 21% dans les deux cas et le poucentage de

similarité est de 35% lors de la comparaison de MTH187 avec l’Aconitase B et de 42%

lorsque la protéine est comparée avec AP2. Malgré la plus grande similarité de séquence

entre MTH187 et AP2, la protéine où l’on retrouve la plus grande homologie structurale

avec MTH187 est l’Aconitase B. La différence de plusieurs acides aminés entre ces deux

protéines n’empêche pas la grande similarité de leurs structures.

Ces protéines homologues à MTH187, en particulier l’Aconitase B, ressemble au

motif structural “Heat repeat’’(Huntingtin-Elongation-A subunit-TOR). Les protéines qui

possèdent cette forme de structures ont une fonction commune de reconnaissance

protéine-protéine dans plusieurs procédés cellulaires (Andrade et al., 2001). Plusieurs

protéines ont également un motif structural "Armadillo repeat'' qui ressemble beaucoup

au model “Heat repeat’’. La fonction de ce type de structure est également une fonction

de reconnaissance protéine-protéine.

La principale différence structurale entre la protéine étudiée MTH187 et les

familles structurales “HEAT repeat’’ et “Armadillo repeat’’ est la longueur des hélices α.

Dans le cas des “HEAT repeat’’, les longueurs des hélices varies entre 37 et 47 résidus et

pour les “Armadillo repeat’’, le nombre de résidus est d’environ 40 (Andrade et al.,

2001). La protéine MTH187 atteint un maximum de 14 résidus dans une hélices α. C’est

77

la principale raison pour laquelle il est sujet d’un domaine ressemblant au motif de

répétition HEAT et non pas d'un ''vrai'' motif HEAT.

La protéine Aconitase B, contenant une région semblable à la région de répétition

HEAT, contient des hélices α beaucoup moins longues. En effet, la superposition de

l’Aconitase B avec MTH187 se révèle de bonne qualité. La superposition des régions

(Table 6) révèle des RMSD acceptables, soit de 1.43 Å à 3.07 Å. Également, la position

des six hélices α une par rapport à l’autre est similaire à celle de l’Aconitase B, le RMSD

est de 2.36 Å pour la chaîne squelettique. Les autres protéines similaires à MTH187,

tirées du logiciel Dali, avaient souvent des difficultés à être superposées correctement ou

bien si la superposition était possible, la RMSD était plus élevée.

Avant la détermination de la structure tridimensionnelle de MTH187, l’homologie

séquentielle révélait que MTH187 ressemblait à une sous-unité α d’une phycocyanine

phycocyanobiline lyase. Une fois la structure tridimensionnelle de MTH187 obtenue, la

comparaison de celle-ci avec les neufs structures des phycocyanines peut être faite. Les

phycocyanines sont toutes composées entièrement d’hélice α. MTH187 est également

composée uniquement d’hélice α mais celle-ci ne sont pas disposées de la même façon.

Le motif structural des phycocyanines n’est pas de la forme “HEAT repeat’’. Lorsque la

structure est différente, nous pouvons supposer une fonction différente, donc MTH187

n’est fort probablement pas une phycocyanine. L’homologie séquentielle doit être une

erreur.

Pour soutenir l'hypothèse que MTH187 appartient à la famille « Heat repeat », une

recherche des domaines conservés a été faite. MTH187 semble avoir une séquence

similaire aux séquences de la famille « Heat repeat ».

78

CHAPITRE 8. CONCLUSION

L’attribution des déplacements chimiques a été faite pour plus de 98% des 111

acides aminés de la protéine MTH187. Dans la chaîne squelettique, seule la glycine 67

n’a pu être attribuée. Par de nombreux calculs, la structure tridimensionnelle de MTH187

a été résolue. La structure est composée de six hélices α positionnées deux à deux dont

les résidus hydrophobes sont regroupés au centre de la protéine. La fonction de MTH187

n’est toujours pas confirmée. Par contre la structure de MTH187 est comparable à une

famille structurale appelée « HEAT repeat ». Cette famille est caractérisée par des

repliements d’un grand nombre de paires d’hélices α antiparallèles formant des supers-

hélices. Cette famille ne contient que de grosses protéines. Par contre MTH187 a

tendance à dimériser. La forme dimérique de MTH187 pourrait davantage ressembler à la

famille « HEAT repeat ». Ces travaux ont grandement contribué à l’amélioration des

connaissances sur la structure et la fonction de MTH187. La structure tridimensionnelle

de MTH187 sera étudiée davantage et sera utilisée entre autre pour la modélisation

moléculaire par homologie structurale de d’autres protéines, plus particulièrement

d’autres protéines de Methanobacterium thermoautotrophicum.

79

BIBLIOGRAPHIE Andrade, M.A., Petosa, C., O'Donoghue, S.I., Muller, C.W. and Bork, P. (2001)

Comparison of ARM and HEAT protein repeats. J. Mol. Biol., 309, 1-18. Anfinsen, C.B. (1973) Principles that govern the folding of protein chains. Science, 181,

223-230. Bax, A. and Ikura, M. (1991) An efficient 3D NMR technique for correlating the proton

and 15N backbone amide resonances with the alpha-carbon of the preceding residue in uniformly 15N/13C enriched proteins. J. Biomol. NMR, 1, 99-104.

Boone, D.R. (2000) Bergey,s Manuel of Systematic bacteriology, New York. Branden, C. and Tooze, J. (1991) Introduction to protein structure. Garland Publishing,

Inc, New York. Braunschweiler, L. and Ernst , R.E. (1983) J. Magn. Reson., 53, 313-340. Brunger, A.T., Adams, P.D., Clore, G.M., DeLano, W.L., Gros, P., Grosse-Kunstleve,

R.W., Jiang, J.S., Kuszewski, J., Nilges, M., Pannu, N.S., Read, R.J., Rice, L.M., Simonson, T. and Warren, G.L. (1998) Crystallography & NMR system: A new software suite for macromolecular structure determination. Acta Crystallogr. D. Biol. Crystallogr., 54 ( Pt 5), 905-921.

Cavanagh, J., Fairbrother, W.J., Palmer, A.G., 3rd and Skelton, N.J. (1996) Protein NMR Spectroscopy Principles and Practice. Academic Press, New York.

Christendat, D., Yee, A., Dharamsi, A., Kluger, Y., Savchenko, A., Cort, J.R., Booth, V., Mackereth, C.D., Saridakis, V., Ekiel, I., Kozlov, G., Maxwell, K.L., Wu, N., McIntosh, L.P., Gehring, K., Kennedy, M.A., Davidson, A.R., Pai, E.F., Gerstein, M., Edwards, A.M. and Arrowsmith, C.H. (2000) Structural proteomics of an archaeon. Nat. Struct. Biol., 7, 903-909.

Clore, G.M., Bax, A. and Gronenborn, A.M. (1991) Stereospecific assignment of beta-methylene protons in larger proteins using 3D 15N-separated Hartmann-Hahn and 13C-separated rotating frame Overhauser spectroscopy. J. Biomol. NMR, 1, 13-22.

Clubb R.T, T.V., Wagner G. (1992) J.Magn. Reson., 97, 213-217. Cornilescu, G., Delaglio, F. and Bax, A. (1999) Protein backbone angle restraints from

searching a database for chemical shift and sequence homology. J. Biomol. NMR, 13, 289-302.

Delaglio, F., Grzesiek, S., Vuister, G.W., Zhu, G., Pfeifer, J. and Bax, A. (1995) NMRPipe: a multidimensional spectral processing system based on UNIX pipes. J. Biomol. NMR, 6, 277-293.

Evans, J.N.S. (1995) Biomolecular NMR Spectroscopy. Oxford University Press, Oxford. Fairchild, C.D., Zhao, J., Zhou, J., Colson, S.E., Bryant, D.A. and Glazer, A.N. (1992)

Phycocyanin alpha-subunit phycocyanobilin lyase. Proc Natl Acad Sci U S A, 89, 7017-7021.

Farrow, N.A., Muhandiram, R., Singer, A.U., Pascal, S.M., Kay, C.M., Gish, G., Shoelson, S.E., Pawson, T., Forman-Kay, J.D. and Kay, L.E. (1994) Backbone dynamics of a free and phosphopeptide-complexed Src homology 2 domain studied by 15N NMR relaxation. Biochemistry, 33, 5984-6003.

Geerten W. Vuister, B.A. (1993) Quantitative J Correlation:Anew Approach for Measuring Homonuclear Three-Bond J(HNHA) Coupling Constants in 15N-Enriched Proteins. J.Am.Chem.Soc., 115, 7772-7777.

80

Grzesiek, S., Dobeli, H., Gentz, R., Garotta, G., Labhardt, A.M. and Bax, A. (1992) 1H, 13C, and 15N NMR backbone assignments and secondary structure of human interferon-gamma. Biochemistry, 31, 8180-8190.

Guex, P. (1997) SWISS-MODEL and the Swiss-PdbViewer: An environment for comparative protein modeling. Electrophoresis, 18, 2714-2723.

Harbison, G.S. (1993) J.Am. Chem. Soc., 115, 3026-3027. Heinemann, U. (2000) Structural genomics in Europe: slow start, strong finish? Nat.

Struct. Biol., 7 Suppl, 940-942. Hol, W.G. (2000) Structural genomics for science and society. Nat. Struct. Biol., 7 Suppl,

964-966. Holm, L. and Sander, C. (1996) Mapping the protein universe. Science, 273, 595-603. Huber, A.H., Nelson, W.J. and Weis, W.I. (1997) Three-dimensional structure of the

armadillo repeat region of beta-catenin. Cell, 90, 871-882. Ikura, M., Kay, L.E. and Bax, A. (1990) A novel approach for sequential assignment of

1H, 13C, and 15N spectra of proteins: heteronuclear triple-resonance three-dimensional NMR spectroscopy. Application to calmodulin. Biochemistry, 29, 4659-4667.

Johnson, B. A., Blevins, .R.A. (1994) NMRView: A computer program for the visualization and analysis of NMR data. J. Biomolecular NMR, 4, 603-614.

Kay, L.E., Iruka, M., Tschudin, R. and Bax, A. (1990) J.Magn. Reson., 89, 496-514. Koradi, R., Billeter, M., and Wüthrich, K. (1996) MOLMOL: a program for display and

analysis of macromolecular structures. J. Mol. Graphics, 14, 51-55. Laskowski, R.A. (1993) Procheck: a program to check the stereochemical quality of

protein structures. J.Appl.Cryst., 26, 283-291. Levitt, M.H. (2001) Spin dynamics, Basics of Nuclear Magnetic Resonance. Wiley, New

York. Linge, J.P., O'Donoghue, S.I. and Nilges, M. (2001) Automated assignment of

ambiguous nuclear overhauser effects with ARIA. Methods Enzymol, 339, 71-90. Lyons, B.A., Tashiro, M., Cedergren, L., Nilsson, B. and Montelione, G.T. (1993) An

improved strategy for determining resonance assignments for isotopically enriched proteins and its application to an engineered domain of staphylococcal protein A. Biochemistry, 32, 7839-7845.

Mandel, A.M., Akke, M. and Palmer, A.G., 3rd. (1995) Backbone dynamics of Escherichia coli ribonuclease HI: correlations with structure and function in an active enzyme. J. Mol. Biol., 246, 144-163.

Muhandiram, D.R., Kay, L.E. (1994) J.Magn. Reson., 103, 203-216. Muller. (1979) L.Am.Chem. Soc, 101, 4481-4484. Olejniczak, E.T., Xu, R.X. and Fesik, S.W. (1992) A 4D HCCH-TOCSY experiment for

assigning the side chain 1H and 13C resonances of proteins. J. Biomol. NMR, 2, 655-659.

Palmer, A.G., 3rd, Fairbrother, W.J., Cavanagh, J., Wright, P.E. and Rance, M. (1992) Improved resolution in three-dimensional constant-time triple resonance NMR spectroscopy of proteins. J. Biomol. NMR, 2, 103-108.

Pelczar, M.J.Jr., Chan, E.C.S. and Krieg, N.R. (1993) Microbiology, Concepts and Applications. McGraw-Will, Inc, New York.

81

Russell, R.B. and Eggleston, D.S. (2000) New roles for structure in biology and drug discovery. Nat. Struct. Biol., 7 Suppl, 928-930.

Sanders, J.K.M. and Hunter, B.K. (1987) Modern NMR Spectroscopy. Oxford University Press, Oxford.

Shao, J.a.W., C.F.J. (1989) A general theory for jackknife variance estimation. Ann. Statist, 17, 1176-1197.

Shindyalov, B. (1998) Protein structure alignment by incremental combinatorial extension (CE) of the optimal path. Protein Engineering, 11, 739-747.

Smith, D.R., Doucette-Stamm, L.A., Deloughery, C., Lee, H., Dubois, J., Aldredge, T., Bashirzadeh, R., Blakely, D., Cook, R., Gilbert, K., Harrison, D., Hoang, L., Keagle, P., Lumm, W., Pothier, B., Qiu, D., Spadafora, R., Vicaire, R., Wang, Y., Wierzbowski, J., Gibson, R., Jiwani, N., Caruso, A., Bush, D., Reeve, J.N. and et al. (1997) Complete genome sequence of Methanobacterium thermoautotrophicum deltaH: functional analysis and comparative genomics. J Bacteriol, 179, 7135-7155.

Tatusov, R.L., Koonin, E.V. and Lipman, D.J. (1997) A genomic perspective on protein families. Science, 278, 631-637.

Tatusov, R.L., Natale, D.A., Garkavtsev, I.V., Tatusova, T.A., Shankavaram, U.T., Rao, B.S., Kiryutin, B., Galperin, M.Y., Fedorova, N.D. and Koonin, E.V. (2001) The COG database: new developments in phylogenetic classification of proteins from complete genomes. Nucleic Acids Res., 29, 22-28.

Terwilliger, T.C. (2000) Structural genomics in North America. Nat. Struct. Biol., 7 Suppl, 935-939.

Van Holde, K.E. and Mathews, C.K. (1990) Biochemistry. The Benjamin/Cummings Plublishing Compagny,Inc., Oregon.

Voet, D. and Voet, J. (1995) Biochemistry, Second Edition. DeBoeck Université, NewYork.

Williams, C.H., Stillman, T.J., Barynin, V.V., Sedelnikova, S.E., Tang, Y., Green, J., Guest, J.R. and Artymiuk, P.J. (2002) E. coli aconitase B structure reveals a HEAT-like domain with implications for protein-protein recognition. Nat. Struct. Biol., 9, 447-452.

Wishart, D.S. and Sykes, B.D. (1994) The 13C chemical-shift index: a simple method for the identification of protein secondary structure using 13C chemical-shift data. J. Biomol. NMR, 4, 171-180.

Wüthrich, K. (1986) NMR of Proteins and Nucleic acids. Wiley Interscience, New York. Yee, A., Pardee, K., Christendat, D., Savchenko, A., Edwards, A.M. and Arrowsmith,

C.H. (2003) Structural proteomics: toward high-throughput structural biology as a tool in functional genomics. Acc. Chem. Res., 36, 183-189.

Yokoyama, S., Hirota, H., Kigawa, T., Yabuki, T., Shirouzu, M., Terada, T., Ito, Y., Matsuo, Y., Kuroda, Y., Nishimura, Y., Kyogoku, Y., Miki, K., Masui, R. and Kuramitsu, S. (2000) Structural genomics projects in Japan. Nat. Struct. Biol., 7 Suppl, 943-945.

82

ANNEXE I

Le temps de corrélation (τc) de la protéine dans l’eau a été obtenue par des calculs

de relaxation soit les valeurs de T1, T2 et NOEs pour certains résidus de MTH187. Les

résultats de ces calculs sont présentés à la figure suivante.

a

b

c

a

b

c

a

b

c

15N-T1 des résidus de MTH187 (a), 15N-T2 (b), et {1H}-15N-NOE (c) à 600 MHz. Seulement 78 résidus ont été utilises pour les calculs de relaxation. Les incertitudes ont été obtenues en utilisant la simulation de Jack Knife. Les résultats indiquent que MTH187 a un τc= 7.3 ns dans l’eau. La structure secondaire est montrée en bleu.

83

ANNEXE II Table des déplacements chimiques de MTH187 1.CA 55.776 1 1.HA 4.423 1 1.CB 33.124 1 1.HB2 2.058 2 1.HB1 1.953 2 1.CG 32.132 1 1.HG2 2.446 2 1.HG1 2.506 2 1.C 175.845 1 2.N 124.471 1 2.HN 8.209 1 2.CA 52.857 1 2.HA 4.318 1 2.CB 19.399 1 2.HB1 1.392 1 2.C 177.419 1 3.N 119.139 1 3.HN 8.130 1 3.CA 54.654 1 3.HA 4.527 1 3.CB 41.350 1 3.HB2 2.628 2 3.HB1 2.700 2 3.C 176.586 1 4.N 120.858 1 4.HN 8.306 1 4.CA 57.486 1 4.HA 4.141 1 4.CB 30.095 1 4.HB2 2.045 2 4.HB1 1.955 2 4.CG 36.249 1 4.HG2 2.236 2 4.HG1 2.236 2 4.C 176.574 1 5.N 118.298 1 5.HN 8.280 1 5.CA 53.839 1 5.HA 4.614 1 5.CB 38.821 1 5.HB2 2.740 2 5.HB1 2.741 2 5.ND2 112.635 1 5.HD21 7.528 2 5.HD22 6.819 2 5.C 175.501 1 6.N 120.257 1 6.HN 7.900 1 6.CA 57.214 1 6.HA 4.143 1

6.CB 32.755 1 6.HB2 1.600 2 6.HB1 1.600 2 6.CG 24.550 1 6.HG2 1.170 2 6.HG1 1.170 2 6.CD 29.137 1 6.HD2 1.561 2 6.HD1 1.561 2 6.CE 42.313 1 6.HE2 2.869 2 6.HE1 2.879 2 6.C 176.454 1 7.N 119.922 1 7.HN 7.883 1 7.CA 57.316 1 7.HA 4.683 1 7.CB 29.600 1 7.HB2 3.221 2 7.HB1 3.329 2 7.CD1 127.073 3 7.HD1 7.244 1 7.NE1 129.151 1 7.HE1 10.117 3 7.CZ2 114.500 3 7.HZ2 7.450 3 7.CH2 124.476 1 7.HH2 7.165 1 7.C 176.127 1 8.N 119.956 1 8.HN 7.626 1 8.CA 62.583 1 8.HA 4.029 1 8.CB 32.810 1 8.HB 2.009 1 8.CG2 20.919 1 8.HG21 0.870 2 8.CG1 21.800 1 8.HG11 0.870 2 8.C 175.733 1 9.N 123.474 1 9.HN 8.054 1 9.CA 56.403 1 9.HA 4.270 1 9.CB 30.901 1 9.HB2 1.759 2 9.HB1 1.882 2 9.CG 27.255 1 9.HD2 3.200 2 9.HD1 3.200 2

9.C 176.356 1 10.N 122.164 1 10.HN 8.245 1 10.CA 56.570 1 10.HA 4.314 1 10.CB 30.949 1 10.HB2 1.850 2 10.HB1 1.793 2 10.CG 27.165 1 10.HG2 1.680 2 10.HG1 1.680 2 10.CD 43.220 1 10.HD2 3.150 2 10.HD1 3.150 2 10.C 176.089 1 11.N 120.824 1 11.HN 8.358 1 11.CA 54.739 1 11.CB 41.032 1 11.HB2 2.688 2 11.HB1 2.688 2 11.C 176.755 1 12.N 119.657 1 12.HN 7.994 1 12.CA 63.424 1 12.HA 4.058 1 12.CB 32.435 1 12.HB 2.155 1 12.CG2 21.148 1 12.HG21 0.895 2 12.CG1 20.700 1 12.HG11 0.919 2 12.C 176.468 1 13.N 117.339 1 13.HN 8.268 1 13.CA 60.086 1 13.HA 4.324 1 13.CB 63.523 1 13.HB2 3.930 2 13.HB1 3.938 2 13.C 175.869 1 14.N 116.157 1 14.HN 8.058 1 14.CA 63.656 1 14.HA 4.227 1 14.CB 69.413 1 14.HB 4.272 1 14.CG2 21.835 1 14.HG21 1.228 1 14.C 175.265 1

84

15.N 124.964 1 15.HN 7.990 1 15.CA 54.042 1 15.HA 4.214 1 15.CB 18.875 1 15.HB1 1.409 1 15.C 178.677 1 16.N 118.397 1 16.HN 8.012 1 16.CA 56.556 1 16.HA 4.232 1 16.CB 42.070 1 16.HB2 1.520 2 16.HB1 1.700 2 16.CG 25.543 1 16.HG 1.551 1 16.CD1 25.172 1 16.HD11 0.875 2 16.CD2 23.820 1 16.HD21 0.875 2 16.C 178.073 1 17.N 114.395 1 17.HN 7.957 1 17.CA 59.920 1 17.HA 4.284 1 17.CB 63.625 1 17.HB2 3.898 2 17.HB1 3.921 2 17.C 175.280 1 18.N 120.801 1 18.HN 7.913 1 18.CA 56.635 1 18.HA 4.381 1 18.CB 30.658 1 18.HB2 1.946 2 18.HB1 1.819 2 18.CG 27.222 1 18.HG2 1.670 2 18.HG1 1.670 2 18.CD 43.626 1 18.HD2 3.192 2 18.HD1 3.192 2 18.C 176.781 1 19.N 119.516 1 19.HN 8.011 1 19.CA 56.812 1 19.HA 4.405 1 19.CB 33.752 1 19.HB2 2.110 2 19.HB1 2.110 2 19.CG 32.646 1 19.HG2 2.562 2 19.HG1 2.674 2 19.CE 20.972 1 19.HE1 0.940 1 19.C 176.725 1 20.N 108.541 1

20.HN 8.321 1 20.CA 45.958 1 20.HA2 4.095 2 20.HA1 4.092 2 20.C 174.742 1 21.N 121.101 1 21.HN 8.380 1 21.CA 56.358 1 21.HA 4.684 1 21.CB 41.237 1 21.HB2 2.822 2 21.HB1 2.730 2 21.C 177.589 1 22.N 119.884 1 22.HN 8.662 1 22.CA 58.274 1 22.HA 4.300 1 22.CB 29.430 1 22.HB2 2.110 2 22.HB1 2.108 2 22.CG 36.578 1 22.HG2 2.345 2 22.HG1 2.437 2 22.C 176.580 1 23.N 120.608 1 23.HN 8.005 1 23.CA 52.616 1 23.HA 4.427 1 23.CB 20.170 1 23.HB1 1.607 1 23.C 176.909 1 24.N 118.125 1 24.HN 7.900 1 24.CA 62.556 1 24.HA 3.349 1 24.CB 39.806 1 24.HB2 2.750 2 24.HB1 2.549 2 24.CD1 131.500 3 24.HD1 6.560 3 24.CE1 130.690 3 24.HE1 7.055 3 24.CZ 128.112 1 24.HZ 6.790 1 24.CE2 130.690 3 24.HE2 7.055 3 24.CD2 131.500 3 24.HD2 6.560 3 24.C 175.992 1 25.N 116.972 1 25.HN 8.605 1 25.CA 62.242 1 25.HA 3.808 1 25.CB 26.375 1 25.HB2 2.182 2 25.HB1 2.055 2 25.CG 37.435 1

25.HG2 2.380 2 25.HG1 2.433 2 25.C 176.638 1 26.N 104.666 1 26.CA 65.712 1 26.HA 4.324 1 26.CB 31.220 1 26.HB2 2.284 2 26.HB1 1.702 2 26.CG 28.078 1 26.HG2 2.133 2 26.HG1 1.977 2 26.CD 50.012 1 26.HD2 3.542 2 26.HD1 3.640 2 26.C 180.227 1 27.N 120.309 1 27.HN 7.241 1 27.CA 58.244 1 27.HA 3.863 1 27.CB 42.076 1 27.HB2 1.843 2 27.HB1 1.067 2 27.CG 27.478 1 27.HG 1.744 1 27.CD1 24.796 1 27.HD11 0.896 2 27.CD2 24.310 1 27.HD21 0.894 2 27.C 177.504 1 28.N 120.825 1 28.HN 8.016 1 28.CA 57.876 1 28.HA 3.498 1 28.CB 41.559 1 28.HB2 0.759 2 28.HB1 1.607 2 28.CG 26.545 1 28.HG 1.273 1 28.CD1 25.416 1 28.HD11 0.784 2 28.CD2 24.306 1 28.HD21 0.697 2 28.C 180.914 1 29.N 118.776 1 29.HN 8.080 1 29.CA 58.995 1 29.HA 3.947 1 29.CB 29.528 1 29.HB2 2.025 2 29.HB1 2.026 2 29.CG 36.154 1 29.HG2 2.203 2 29.HG1 2.324 2 29.CD 0.000 1 29.C 179.593 1 30.N 115.608 1

85

30.HN 7.661 1 30.CA 62.301 1 30.HA 4.324 1 30.CB 63.746 1 30.HB2 3.722 2 30.HB1 4.143 2 30.HG 0.000 1 30.C 174.835 1 31.N 118.715 1 31.HN 7.356 1 31.CA 56.920 1 31.HA 4.135 1 31.CB 40.483 1 31.HB2 1.949 2 31.HB1 1.507 2 31.CG 25.671 1 31.HG 2.181 1 31.CD1 27.315 1 31.HD11 0.853 2 31.CD2 21.715 1 31.HD21 0.698 2 31.C 176.178 1 32.N 108.905 1 32.HN 7.384 1 32.CA 57.243 1 32.HA 4.612 1 32.CB 64.095 1 32.HB2 3.919 2 32.HB1 3.995 2 32.C 174.322 1 33.N 123.005 1 33.HN 7.501 1 33.CA 55.455 1 33.HA 4.346 1 33.CB 41.361 1 33.HB2 2.535 2 33.HB1 2.926 2 33.ND2 114.090 1 33.HD21 8.057 2 33.HD22 6.959 2 33.C 175.248 1 34.N 124.677 1 34.HN 8.916 1 34.CA 58.841 1 34.HA 4.055 1 34.CB 29.886 1 34.HB2 2.085 2 34.HB1 2.155 2 34.CG 36.314 1 34.HG2 2.380 2 34.HG1 2.380 2 34.C 176.577 1 35.N 122.980 1 35.HN 9.222 1 35.CA 53.704 1 35.HA 4.816 1 35.CB 42.270 1

35.HB2 2.572 2 35.HB1 3.011 2 35.C 177.487 1 36.N 128.634 1 36.HN 8.322 1 36.CA 59.831 1 36.HA 4.264 1 36.CB 28.018 1 36.HB2 3.538 2 36.HB1 3.655 2 36.CD1 128.510 3 36.HD1 7.763 1 36.NE1 130.318 1 36.HE1 10.268 2 36.CZ2 114.690 3 36.HZ2 7.515 3 36.CH2 124.400 1 36.HH2 7.005 1 36.C 177.127 1 37.N 121.988 1 37.HN 7.856 1 37.CA 59.683 1 37.HA 3.444 1 37.CB 29.378 1 37.HB2 1.239 2 37.HB1 1.380 2 37.CG 24.945 1 37.HG2 0.047 2 37.HG1 -0.393 2 37.CD 43.058 1 37.HD2 2.603 2 37.HD1 2.680 2 37.C 178.013 1 38.N 117.623 1 38.HN 6.703 1 38.CA 64.370 1 38.HA 3.617 1 38.CB 38.221 1 38.HB 1.887 1 38.CG1 28.934 2 38.HG12 1.510 1 38.HG11 0.998 1 38.CD1 11.829 1 38.HD11 0.869 1 38.CG2 17.346 1 38.HG21 0.979 2 38.C 177.109 1 39.N 118.119 1 39.HN 8.199 1 39.CA 59.596 1 39.HA 4.281 1 39.CB 31.761 1 39.HB2 1.893 2 39.HB1 2.100 2 39.CG 28.625 1 39.HG2 1.798 2 39.HG1 1.655 2

39.CD 43.871 1 39.HD2 3.564 2 39.HD1 3.240 2 39.C 178.720 1 40.N 104.188 1 40.HN 8.620 1 40.CA 48.500 1 40.HA2 3.780 2 40.HA1 3.780 2 40.C 174.383 1 41.N 124.556 1 41.HN 7.918 1 41.CA 56.244 1 41.HA 4.134 1 41.CB 18.462 1 41.HB1 1.577 1 41.C 178.859 1 42.N 117.124 1 42.HN 8.135 1 42.CA 55.533 1 42.HA 3.926 1 42.CB 18.941 1 42.HB1 1.403 1 42.C 178.571 1 43.N 120.433 1 43.HN 8.288 1 43.CA 55.647 1 43.HA 3.704 1 43.CB 17.820 1 43.HB1 1.303 1 43.C 178.524 1 44.N 114.350 1 44.HN 8.060 1 44.CA 61.433 1 44.HA 3.916 1 44.CB 30.065 1 44.HB2 3.193 2 44.HB1 3.326 2 44.CD1 127.997 3 44.HD1 6.910 1 44.NE1 129.236 1 44.HE1 8.765 3 44.CE2 0.000 2 44.CZ2 114.138 3 44.HZ2 7.310 3 44.CH2 124.260 1 44.HH2 7.127 1 44.CZ3 118.228 3 44.HZ3 6.834 3 44.CD2 0.000 2 44.C 177.816 1 45.N 114.570 1 45.HN 7.794 1 45.CA 63.736 1 45.HA 4.046 1 45.CB 39.820 1 45.HB 1.890 1

86

45.CG1 29.247 2 45.HG12 1.952 1 45.HG11 1.229 1 45.CD1 14.258 1 45.HD11 0.878 1 45.CG2 19.095 1 45.HG21 1.055 2 45.C 179.210 1 46.N 119.132 1 46.HN 8.490 1 46.CA 65.955 1 46.HA 4.226 1 46.CB 38.609 1 46.HB 2.118 1 46.CG1 31.000 2 46.HG12 1.529 1 46.HG11 1.573 1 46.CD1 14.761 1 46.HD11 0.474 1 46.CG2 18.097 1 46.HG21 1.038 2 46.C 177.556 1 47.N 110.660 1 47.HN 8.444 1 47.CA 47.288 1 47.HA2 3.848 2 47.HA1 3.997 2 47.C 174.417 1 48.N 116.622 1 48.HN 8.065 1 48.CA 55.675 1 48.HA 4.415 1 48.CB 39.068 1 48.HB2 2.610 2 48.HB1 2.609 2 48.ND2 113.156 1 48.HD21 7.627 2 48.HD22 7.117 2 48.C 175.992 1 49.N 115.037 1 49.HN 7.659 1 49.CA 59.938 1 49.HA 4.224 1 49.CB 39.247 1 49.HB2 3.280 2 49.HB1 3.280 2 49.CD1 132.385 3 49.HD1 7.620 3 49.CE1 131.509 3 49.HE1 7.358 3 49.CE2 131.509 3 49.HE2 7.358 3 49.CD2 132.385 3 49.HD2 7.620 3 49.C 175.167 1 50.N 113.502 1 50.HN 8.088 1

50.CA 57.507 1 50.HA 3.617 1 50.CB 27.320 1 50.HB2 2.363 2 50.HB1 2.184 2 50.CG 34.939 1 50.HG2 2.178 2 50.HG1 2.321 2 50.NE2 111.421 1 50.HE21 7.482 2 50.HE22 6.795 2 50.C 172.751 1 51.N 119.167 1 51.HN 8.306 1 51.CA 53.124 1 51.HA 4.814 1 51.CB 44.501 1 51.HB2 1.835 2 51.HB1 2.689 2 51.C 177.763 1 52.N 125.785 1 52.HN 9.091 1 52.CA 58.639 1 52.HA 4.029 1 52.CB 29.658 1 52.HB2 2.130 2 52.HB1 2.130 2 52.CG 36.834 1 52.HG2 2.396 2 52.HG1 2.240 2 52.C 178.109 1 53.N 122.531 1 53.HN 9.549 1 53.CA 59.466 1 53.HA 4.168 1 53.CB 30.997 1 53.HB2 1.975 2 53.HB1 1.975 2 53.CG 27.511 1 53.HG2 2.020 2 53.HG1 1.920 2 53.CD 43.815 1 53.HD2 3.190 2 53.HD1 3.190 2 53.C 177.470 1 54.N 114.993 1 54.HN 7.767 1 54.CA 52.107 1 54.HA 4.213 1 54.CB 19.945 1 54.HB1 1.447 1 54.C 176.546 1 55.N 117.083 1 55.HN 7.545 1 55.CA 68.699 1 55.HA 3.261 1 55.CB 31.371 1

55.HB 2.149 1 55.CG2 20.644 1 55.HG21 0.695 2 55.CG1 25.351 1 55.HG11 1.044 2 55.C 175.840 1 56.N 117.032 1 56.HN 8.713 1 56.CA 62.191 1 56.HA 4.045 1 56.CB 26.649 1 56.HB2 2.081 2 56.HB1 2.080 2 56.CG 36.851 1 56.HG2 2.226 2 56.HG1 2.301 2 56.C 177.068 1 57.N 104.392 1 57.CA 65.733 1 57.HA 4.246 1 57.CB 31.265 1 57.HB2 2.239 2 57.HB1 1.661 2 57.CG 27.840 1 57.HG2 1.980 2 57.HG1 1.940 2 57.C 179.260 1 58.N 116.630 1 58.HN 7.519 1 58.CA 58.219 1 58.HA 4.012 1 58.CB 41.936 1 58.HB2 2.137 2 58.HB1 1.129 2 58.CG 26.268 1 58.HG 2.006 1 58.CD1 22.729 1 58.HD11 0.932 2 58.CD2 27.239 1 58.HD21 0.621 2 58.C 178.747 1 59.N 118.799 1 59.HN 8.290 1 59.CA 63.733 1 59.HA 3.568 1 59.CB 36.515 1 59.HB 2.147 1 59.CG1 28.225 2 59.HG12 1.536 1 59.HG11 1.261 1 59.CD1 12.950 1 59.HD11 0.622 1 59.CG2 17.422 1 59.HG21 0.851 2 59.C 180.037 1 60.N 118.820 1 60.HN 7.259 1

87

60.CA 59.066 1 60.HA 4.094 1 60.CB 31.968 1 60.HB2 1.930 2 60.HB1 1.931 2 60.CG 25.066 1 60.HG2 1.584 2 60.HG1 1.478 2 60.CD 28.941 1 60.HD2 1.685 2 60.HD1 1.680 2 60.CE 42.330 1 60.HE2 2.958 2 60.HE1 2.958 2 60.C 179.579 1 61.N 118.257 1 61.HN 7.492 1 61.CA 56.494 1 61.HA 4.168 1 61.CB 41.199 1 61.HB2 1.997 2 61.HB1 1.520 2 61.CG 26.935 1 61.HG 0.970 1 61.CD1 22.938 1 61.HD11 1.016 2 61.CD2 22.500 1 61.HD21 1.024 2 61.C 178.146 1 62.N 118.214 1 62.HN 7.548 1 62.CA 57.410 1 62.HA 4.208 1 62.CB 41.825 1 62.HB2 2.150 2 62.HB1 1.462 2 62.CG 25.861 1 62.HG 2.059 1 62.CD1 23.026 1 62.HD11 0.900 2 62.CD2 26.202 1 62.HD21 0.820 2 62.C 176.768 1 63.N 112.580 1 63.HN 7.257 1 63.CA 54.945 1 63.HA 4.512 1 63.CB 30.129 1 63.HB2 1.924 2 63.HB1 2.399 2 63.CG 36.662 1 63.HG2 2.265 2 63.HG1 2.271 2 63.C 176.196 1 64.N 122.241 1 64.HN 7.325 1 64.CA 55.619 1

64.HA 4.238 1 64.CB 44.384 1 64.HB2 2.945 2 64.HB1 2.654 2 64.C 175.721 1 65.N 123.636 1 65.HN 8.340 1 65.CA 56.509 1 65.HA 4.364 1 65.CB 41.572 1 65.HB2 2.615 2 65.HB1 2.614 2 65.CG 0.000 1 65.C 177.074 1 66.N 115.390 1 66.HN 9.679 1 66.CA 56.826 1 66.HA 4.440 1 66.CB 62.980 1 66.HB2 3.719 2 66.HB1 4.087 2 66.C 176.840 1 67.CA 47.400 1 67.HA2 3.570 2 67.HA1 3.930 2 67.C 176.070 1 68.N 122.900 1 68.HN 8.130 1 68.CA 61.055 1 68.HA 4.625 1 68.CB 40.281 1 68.HB2 3.523 2 68.HB1 3.030 2 68.CD1 131.500 3 68.HD1 7.525 3 68.CE1 131.970 3 68.HE1 7.220 3 68.CZ 129.277 1 68.HZ 6.860 1 68.CE2 131.970 3 68.HE2 7.220 3 68.CD2 131.500 3 68.HD2 7.525 3 68.C 176.783 1 69.N 118.134 1 69.HN 7.222 1 69.CA 66.188 1 69.HA 3.435 1 69.CB 32.305 1 69.HB 2.349 1 69.CG2 23.823 1 69.HG21 1.046 2 69.CG1 22.681 1 69.HG11 1.403 2 69.C 177.341 1 70.N 116.594 1 70.HN 8.126 1

70.CA 59.951 1 70.HA 4.045 1 70.CB 30.703 1 70.HB2 1.610 2 70.HB1 1.789 2 70.CG 27.076 1 70.HG2 1.703 2 70.HG1 1.406 2 70.CD 43.936 1 70.HD2 2.560 2 70.HD1 3.220 2 70.C 178.511 1 71.N 113.249 1 71.HN 7.924 1 71.CA 62.379 1 71.HA 4.074 1 71.CB 63.191 1 71.HB2 4.027 2 71.HB1 4.027 2 71.C 175.895 1 72.N 111.973 1 72.HN 7.033 1 72.CA 44.297 1 72.HA2 1.498 2 72.HA1 1.963 2 72.C 174.044 1 73.N 122.869 1 73.HN 8.069 1 73.CA 55.131 1 73.HA 3.900 1 73.CB 18.205 1 73.HB1 1.371 1 73.C 178.814 1 74.N 118.240 1 74.HN 7.807 1 74.CA 55.718 1 74.HA 3.777 1 74.CB 18.535 1 74.HB1 1.484 1 74.C 179.299 1 75.N 118.288 1 75.HN 7.514 1 75.CA 58.996 1 75.HA 4.011 1 75.CB 29.137 1 75.HB2 1.626 2 75.HB1 1.629 2 75.CG 26.733 1 75.HG2 1.827 2 75.HG1 1.720 2 75.CD 43.531 1 75.HD2 3.283 2 75.HD1 3.077 2 75.C 179.769 1 76.N 118.062 1 76.HN 8.645 1 76.CA 63.509 1

88

76.HA 4.292 1 76.CB 63.502 1 76.HB2 4.090 2 76.HB1 3.346 2 76.HG 0.000 1 76.C 176.300 1 77.N 122.775 1 77.HN 8.333 1 77.CA 58.939 1 77.HA 3.834 1 77.CB 41.857 1 77.HB2 0.965 2 77.HB1 1.866 2 77.CG 27.476 1 77.HG 1.695 1 77.CD1 26.166 1 77.HD11 0.591 2 77.CD2 25.136 1 77.HD21 0.861 2 77.C 178.070 1 78.N 117.352 1 78.HN 7.427 1 78.CA 59.581 1 78.HA 3.962 1 78.CB 29.221 1 78.HB2 2.317 2 78.HB1 2.264 2 78.CG 36.522 1 78.HG2 2.300 2 78.HG1 2.470 2 78.C 178.079 1 79.N 117.851 1 79.HN 7.787 1 79.CA 58.187 1 79.HA 4.014 1 79.CB 29.410 1 79.HB2 2.052 2 79.HB1 2.178 2 79.CG 33.823 1 79.HG2 2.332 2 79.HG1 2.386 2 79.NE2 109.998 1 79.HE21 7.312 2 79.HE22 6.565 2 79.C 177.843 1 80.N 119.280 1 80.HN 7.875 1 80.CA 65.778 1 80.HA 3.525 1 80.CB 39.874 1 80.HB 1.702 1 80.CG1 29.757 2 80.HG12 2.180 1 80.HG11 2.180 1 80.CD1 15.536 1 80.HD11 0.713 1 80.CG2 16.698 1

80.HG21 0.833 2 80.C 177.155 1 81.N 104.195 1 81.HN 7.857 1 81.CA 45.496 1 81.HA2 3.806 2 81.HA1 4.019 2 81.C 172.964 1 82.N 104.719 1 82.HN 8.027 1 82.CA 45.039 1 82.HA2 3.988 2 82.HA1 4.473 2 82.C 176.157 1 83.N 119.107 1 83.HN 8.810 1 83.CA 59.285 1 83.HA 4.093 1 83.CB 29.947 1 83.HB2 2.087 2 83.HB1 2.089 2 83.CG 36.237 1 83.HG2 2.380 2 83.HG1 2.380 2 83.C 179.137 1 84.N 121.215 1 84.HN 8.819 1 84.CA 59.081 1 84.HA 4.165 1 84.CB 29.371 1 84.HB2 1.849 2 84.HB1 2.051 2 84.CG 27.907 1 84.HG2 1.754 2 84.HG1 1.650 2 84.CD 43.134 1 84.HD2 3.229 2 84.HD1 3.218 2 84.C 179.943 1 85.N 119.126 1 85.HN 7.368 1 85.CA 67.302 1 85.HA 3.298 1 85.CB 32.159 1 85.HB 1.654 1 85.CG2 21.888 1 85.HG21 0.306 2 85.CG1 25.374 1 85.HG11 0.982 2 85.C 177.136 1 86.N 119.381 1 86.HN 7.793 1 86.CA 61.235 1 86.HA 3.563 1 86.CB 29.318 1 86.HB2 2.128 2 86.HB1 1.871 2

86.CG 28.085 1 86.HG2 1.576 2 86.HG1 1.751 2 86.CD 42.995 1 86.HD2 3.270 2 86.HD1 3.276 2 86.C 177.761 1 87.N 118.779 1 87.HN 8.044 1 87.CA 55.051 1 87.HA 4.144 1 87.CB 18.225 1 87.HB1 1.484 1 87.C 180.738 1 88.N 120.572 1 88.HN 7.611 1 88.CA 54.881 1 88.HA 4.114 1 88.CB 18.271 1 88.HB1 1.393 1 88.C 180.645 1 89.N 117.325 1 89.HN 8.471 1 89.CA 57.088 1 89.HA 4.197 1 89.CB 31.355 1 89.HB2 1.830 2 89.HB1 2.285 2 89.CG 32.902 1 89.HG2 2.550 2 89.HG1 1.750 2 89.C 178.298 1 90.N 120.174 1 90.HN 8.566 1 90.CA 60.206 1 90.HA 3.922 1 90.CB 29.637 1 90.HB2 2.050 2 90.HB1 2.218 2 90.CG 37.214 1 90.HG2 2.550 2 90.HG1 2.228 2 90.C 179.225 1 91.N 117.813 1 91.HN 7.260 1 91.CA 58.876 1 91.HA 4.223 1 91.CB 31.980 1 91.HB2 1.930 2 91.HB1 1.930 2 91.CG 24.816 1 91.HG2 1.446 2 91.HG1 1.532 2 91.CD 28.756 1 91.HD2 1.699 2 91.HD1 1.699 2 91.CE 42.436 1

89

91.HE2 2.960 2 91.HE1 2.960 2 91.C 179.804 1 92.N 122.334 1 92.HN 8.070 1 92.CA 57.399 1 92.HA 3.967 1 92.CB 43.464 1 92.HB2 1.249 2 92.HB1 1.767 2 92.CG 27.401 1 92.HG 1.610 1 92.CD1 24.283 1 92.HD11 0.833 2 92.CD2 24.973 1 92.HD21 0.833 2 92.C 179.013 1 93.N 120.383 1 93.HN 8.423 1 93.CA 54.860 1 93.HA 3.962 1 93.CB 18.448 1 93.HB1 1.371 1 93.C 178.020 1 94.N 114.261 1 94.HN 7.300 1 94.CA 58.086 1 94.HA 4.358 1 94.CB 31.292 1 94.HB2 2.189 2 94.HB1 2.189 2 94.CG 36.161 1 94.HG2 2.251 2 94.HG1 2.430 2 94.C 178.529 1 95.N 106.487 1 95.HN 8.077 1 95.CA 61.889 1 95.HA 4.613 1 95.CB 71.092 1 95.HB 4.390 1 95.CG2 21.812 1 95.HG21 1.215 1 95.C 175.615 1 96.N 111.590 1 96.HN 8.387 1 96.CA 44.885 1 96.HA2 3.697 2 96.HA1 4.383 2 96.C 172.647 1 97.N 109.639 1 97.HN 8.306 1 97.CA 60.477 1 97.HA 4.654 1 97.CB 71.819 1 97.HB 4.244 1 97.CG2 21.316 1

97.HG21 1.207 1 97.C 175.108 1 98.N 108.542 1 98.HN 8.481 1 98.CA 46.653 1 98.HA2 4.070 2 98.HA1 3.858 2 98.C 175.352 1 99.N 126.862 1 99.HN 8.915 1 99.CA 61.662 1 99.HA 4.169 1 99.CB 39.348 1 99.HB2 3.300 2 99.HB1 3.165 2 99.CD1 132.160 3 99.HD1 7.400 3 99.CE1 131.660 3 99.HE1 7.276 3 99.CZ 129.660 1 99.HZ 7.070 1 99.CE2 131.660 3 99.HE2 7.276 3 99.CD2 132.160 3 99.HD2 7.400 3 99.C 176.274 1 100.N 119.980 1 100.HN 8.581 1 100.CA 55.619 1 100.HA 3.781 1 100.CB 19.246 1 100.HB1 1.511 1 100.C 178.285 1 101.N 114.769 1 101.HN 6.848 1 101.CA 59.275 1 101.HA 3.677 1 101.CB 29.899 1 101.HB2 1.235 2 101.HB1 1.599 2 101.CG 27.787 1 101.HG2 1.554 2 101.HG1 1.679 2 101.CD 43.190 1 101.HD2 3.166 2 101.HD1 3.102 2 101.C 177.194 1 102.N 118.290 1 102.HN 7.484 1 102.CA 59.628 1 102.HA 3.858 1 102.CB 32.316 1 102.HB2 1.810 2 102.HB1 1.810 2 102.CG 24.979 1 102.HG2 1.353 2 102.HG1 1.510 2

102.CD 29.314 1 102.HD2 1.666 2 102.HD1 1.666 2 102.CE 42.321 1 102.HE2 2.980 2 102.HE1 2.980 2 102.C 179.505 1 103.N 119.101 1 103.HN 8.106 1 103.CA 65.942 1 103.HA 3.423 1 103.CB 31.723 1 103.HB 1.901 1 103.CG2 23.380 1 103.HG21 0.443 2 103.CG1 20.791 1 103.HG11 0.747 2 103.C 178.067 1 104.N 124.074 1 104.HN 7.740 1 104.CA 55.641 1 104.HA 4.451 1 104.CB 20.032 1 104.HB1 1.595 1 104.C 179.323 1 105.N 117.214 1 105.HN 8.552 1 105.CA 66.852 1 105.HA 3.586 1 105.CB 31.909 1 105.HB 2.071 1 105.CG2 21.123 4 105.HG21 0.955 4 105.CG1 22.885 4 105.HG11 1.099 4 105.C 178.822 1 106.N 116.863 1 106.HN 7.804 1 106.CA 56.838 1 106.HA 4.458 1 106.CB 39.260 1 106.HB2 2.783 2 106.HB1 2.787 2 106.ND2 112.785 1 106.HD21 7.808 2 106.HD22 6.866 2 106.C 177.909 1 107.N 122.295 1 107.HN 8.771 1 107.CA 62.561 1 107.HA 3.963 1 107.CB 38.923 1 107.HB2 3.107 2 107.HB1 3.229 2 107.CD1 132.590 3 107.HD1 6.740 3 107.CE1 116.970 3

90

107.HE1 6.280 3 107.CE2 116.970 3 107.HE2 6.280 3 107.CD2 132.590 3 107.HD2 6.740 3 107.C 179.078 1 108.N 119.384 1 108.HN 8.399 1 108.CA 57.405 1 108.HA 4.121 1 108.CB 41.459 1 108.HB2 1.632 2 108.HB1 1.976 2 108.CG 26.877 1 108.HG 2.058 1 108.CD1 26.000 1 108.HD11 0.830 2

108.CD2 22.497 1 108.HD21 0.986 2 108.C 178.603 1 109.N 116.503 1 109.HN 7.838 1 109.CA 58.477 1 109.HA 4.216 1 109.CB 30.457 1 109.HB2 2.111 2 109.HB1 2.221 2 109.CG 36.750 1 109.HG2 2.307 2 109.HG1 2.533 2 109.C 178.095 1 110.N 105.927 1 110.HN 7.363 1 110.CA 61.402 1

110.HA 4.370 1 110.CB 70.714 1 110.HB 4.163 1 110.CG2 21.774 1 110.HG21 1.135 1 110.HG1 4.200 1 110.C 173.594 1 111.N 125.239 1 111.HN 7.341 1 111.CA 57.596 1 111.HA 4.390 1 111.CB 30.002 1 111.HB2 2.278 2 111.HB1 3.189 2 111.C 178.435 1