PROJET DE RECHERCHE - m2p-egpr.ups-tlse.fr archives/55 - Conception d'un... · améliorant la...

Master 2 EGPR 2016-2017

Conception d’un polypeptide de fusion personnalisable

améliorant la solubilité et le repliement des protéines recombinantes

PROJET DE RECHERCHE

AUTEURS :

Loïc Grandvuillemin

Noureldin Youssef

Amine Belaouad

VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE

2

Remerciements

Dans un premier temps, nous souhaitons remercier Rémy Poupot pour ses judicieux conseils

ainsi que pour le temps précieux qu’il nous a accordé.

Nous remercions également Laurence Nieto pour ses questions et remarques qui nous auront

poussés à développer davantage notre esprit scientifique.

Un grand merci aussi à Laurent Paquereau pour le temps qu’il nous a consacré, bien qu’il ne

soit initialement pas impliqué dans l’encadrement. Son expertise nous aura en effet été d’un grand

secours.

Nous remercions aussi Samuel Tranier pour ses enseignements. Ces derniers nous ont permis

d’avancer énormément au niveau de notre projet.

Enfin, nous remercions l’ensemble de la promotion du M2 EGPR 2016-2017 pour la super

ambiance, mais aussi et surtout pour les fous rires (!).


3

ABBREVIATIONS

F : Phenylalanine

I : Isoleucine

M : Methionine

V: Valine

W: Tryptophane

Y: Tyrosine

N : Asparagine

Q : Glutamine

H : Histidine

K : Lysine

R : Arginine

A : Alanine

E : Glutamine

G : Proline

S : Sérine

T : Thréonine

E-XTEN : Exénatide – XTEN

E. coli : Escherichia coli

SDS-PAGE : Dodécylsulfate de sodium – Electrophorèse sur gel de polyacrylamide

GLP-1 : Glucagon-like peptide 1

kDa : Kilo Dalton

SEC-MALLS : Chromatographie d’exclusion- Diffusion multi-angles de lumière de laser

BSA : Albumine de sérum bovin

PEG : Polyéthylène glycol

ELSPAR : Asparaginase

ELISA : Enzyme-linked immunosorbent assay

IgG : Immunoglobuline G

HRP : Peroxydase de raifort

ABTS : Acide 2,2'-azino-bis(3-éthylbenzothiazoline-6-sulphonique

mg : Milligramme

kg : Kilogramme

h : Heure

ml : Millilitre


4

Hpred : Valeur prédite chez l’homme pour le paramètre correspondant

R2 : Coefficient de détermination

Cl : Clairance

Vd : Volume de distribution

MBP : Maltose Binding Protein

NusA : Substance de N-utilization

SET : Etiquette d’amélioration de solubilité

SEP : Peptide d’amélioration de solubilité

Trx : Thioredoxine

GST : Glutathion S-Transférase

TIMP1 : Inhibiteur des metalloprotéases des tissus de classe 1

CAT : Chloramphenicol acétyl transférase

GFP : Green fluorescent protein

TEV : Tobacco etch virus

HPV : Papillomavirus humain

SAFT : Théorie statistique associée aux fluides

pH : Pouvoir Hydrodynamique

EMBL : Laboratoire européen de biologie moléculaire

DTEN : DnaK-TEN

DLS : Diffusion dynamique de la lumière

MS : Spectrométrie de masse

SAXS : Diffusion des rayons X aux petits angles

CAPN2 : Sous-unité catalytique de Calpain-2

MAR1 : déacetylase d’histones SIR2 NAD-dépendente

Q9UH52 : Récepteur d’importation mitochondriale homologue deTOM6

SMPX : Petite protéine musculaire

Q9UMT3/ YRO : Protéine liant la tyrosine kinase

Q9Y260 : ABP/ZF

SAA : Protéine A-1 du sérum amyloide

BC10 : Protéine associée au cancer de la vessie

NCYM : Protéine N-cym

Q9UM71 : Prothymosine a14

MCS : Cycline mcs2

DAP1 : Régulateur du cytochrome P450


5

RPP14 : Sous-unité p14 de la ribonucléase P

PPR8 : Pentatricopeptide repeat-containing protein 8, mitochondrial

HSP1 : Heat shock protein 90

His-tag: étiquette histidine

ZZ : l’étiquette synthétique de la région liant les chaînes lourdes au domaine B de la protéine A

Gb1 : fragment de la protéine G

RPS3 : Protéine ribosomale S3

TMB : 3,3′,5,5′-Tetraméthylbenzidine

SAA : Sérum Amyloide

ADN : Acide désoxyribonucléique

ARN : Acide ribonucléique

LB : Milieu Luria-Bertani

Co-IP : Co-Immunoprécipitation

SPR : Résonance de surface plasmonique

qPCR : Réaction quantitative en chaîne par polymérase


6

TABLE DES MATIÈRES

REMERCIEMENTS ............................................................................................................................................. 2

ABBREVIATIONS .............................................................................................................................................. 3

ANALYSE D’UNE PUBLICATION : XTEN.............................................................................................................. 7

1) XTEN : CONCEPTION ET CARACTERISATION ......................................................................................................... 7

2) XTEN : IMMUNOGENICITE ............................................................................................................................. 11

3) XTEN & DUREE DE DEMI-VIE DES PROTEINES RECOMBINANTES .............................................................................. 13

INTRODUCTION : VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE ............................................................. 17

1) PRODUCTION DE PROTEINES RECOMBINANTES CHEZ E. COLI : LES LIMITES ................................................................ 17

2) LES ETIQUETTES D’EXPRESSION ACTUELLES ET LEUR(S) MECANISME(S) ..................................................................... 21

3) DNAK : UNE CHAPERONE D’IMPORTANCE MAJEURE CHEZ E. COLI ........................................................................... 23

4) NOTRE PROJET ............................................................................................................................................. 25

CONCEPTION DE L’ETIQUETTE D’EXPRESSION : DTEN .................................................................................... 29

1) STRUCTURE PRIMAIRE ET TAILLE DE DTEN ......................................................................................................... 29

2) DTEN ET IMMUNOGENICITE ........................................................................................................................... 31

4) CONSTRUCTION PLASMIDIQUE ......................................................................................................................... 33

DTEN ET DNAK : SOLUBILITE & REPLIEMENT .................................................................................................. 35

1) CRIBLAGE D’UNE BANQUE DE PEPTIDES INTERAGISSANT POTENTIELLEMENT AVEC DNAK .............................................. 35

2) ETUDE DE L’INTERACTION ENTRE DTEN ET DNAK ............................................................................................... 35

CRIBLAGE & CARACTERISATION DE DTEN ...................................................................................................... 37

1) METHODE DE CRIBLAGE ................................................................................................................................. 37

2) CARACTERISATION DES POLYPEPTIDES DTEN ..................................................................................................... 39

DTEN VS ETIQUETTES D’EXPRESSION ACTUELLES ........................................................................................... 41

1) ETUDE DE L’EFFICACITE DE DTEN SUR PLUSIEURS PROTEINES PEU SOLUBLES ............................................................. 41

2) DTEN VS ETIQUETTES D’EXPRESSION CONVENTIONNELLES .................................................................................... 43

3) ETUDE DE L’IMPACT DE DTEN SUR L’ACTIVITE DE LA LUCIFERASE RENILLA ................................................................ 45

4) IMPACT DE DTEN SUR LES INTERACTIONS PROTEINES-PROTEINES ET PROTEINES-ACIDES NUCLEIQUES ............................ 45

5) DETERMINATION DES MEILLEURS RATIO ACTIVITE / SOLUBILITE ............................................................................... 47

CONCLUSION & PERSPECTIVES ...................................................................................................................... 51

BIBLIOGRAPHIE .............................................................................................................................................. 52


7

Analyse d’une publication : XTEN

Parmi les défis actuels que confronte l’industrie pharmaceutique, le temps de demi-vie des

médicaments biologiques représente un enjeu majeur. En effet, celui-ci est très discuté au sein de la

communauté scientifique et les entreprises pharmaceutiques sont encore et toujours à la recherche

de technologies innovantes permettant d’améliorer cette durée de demi-vie. Le but est d’espacer les

prises de médicaments et donc de diminuer les coûts extrêmement important liés aux traitements.

Pour résoudre ce problème, Dr. Schellenberger et ses collaborateurs se sont lancés dans le

développement d’un long polypeptide non structuré permettant d’augmenter la durée de demi-vie

des protéines auxquelles il est fusionné. La technologie a été reportée dans un article s’intitulant « A

recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner »

(1). La publication est parue dans le journal Nature Biotechnology. Cette technologie a mené à la

création d’Amunix, Californie, USA, dont Dr. Schellenberger est le CEO.

1) XTEN : Conception et caractérisation

Ce polypeptide non structuré que cette équipe a développé a été nommé XTEN. Pour aboutir

à XTEN, Dr. Schellenberger et ses collaborateurs ont d’abord sélectionné les acides aminés qui

composeraient un tel polypeptide. Tout d’abord, les acides aminés hydrophobes (F, I, L, M, V, W et Y)

ont été exclus pour deux raisons. La première est que ceux-ci contribuent à des structures compactes

et/ou l’agrégation. La seconde raison est que ces acides aminés sont réputés pour être reconnus par

le complexe majeur d’histocompatibilité (2) et donc peuvent impliquer une certaine immunogénicité,

néfaste dans le cas des protéines médicaments. D’autres acides aminés ont des propriétés indésirables

pour une molécule destinée à un usage clinique. Ainsi, les auteurs ont aussi exclu les acides aminés

qui comportent des fonctions amides (N, Q). En effet, ils participent à l’instabilité à long terme des

biomédicaments car ils sont instables chimiquement. Pour continuer, les acides aminés chargés

positivement (H, K, R) ont aussi été écartés car ils participent aux liaisons avec la membrane cellulaire.

Enfin, les cystéines ont aussi été bannies car elles sont connues pour contribuer fortement à

l’agrégation via les ponts disulfures.

De cette manière, les auteurs ont choisi les 6 aminés qui composeront leur polypeptide :

Alanine (A), glutamine (E), glycine (G), proline (P), sérine (S) et thréonine (T). Ils ont ensuite généré

une librairie de séquences à partir de ces 6 acides aminés. Cette librairie inclus uniquement des

segments de 36 acides aminés, ces derniers étant placés aléatoirement. Chaque segment comporte

un pourcentage précis des acides aminés sélectionnés précédemment (8% A, 12% E, 18% G, 17% P,


8


9

28% S et 17% T). Il n’y a pas plus de précisions concernant la méthode choisie pour déterminer ces

pourcentages. Pour poursuivre, un criblage a été réalisé sur ~1500 fragments afin de choisir les

fragments les mieux exprimés, pour arriver au final à 5 fragments. Ces 5 fragments ont ensuite été

discriminés en fonction de plusieurs critères : stabilité génétique, solubilité, thermostabilité et

résistance à l’agrégation. En utilisant cette méthode, une seule séquence a été choisie pour les études

qui vont suivre, celle-ci a été nommée XTEN.

Afin de réunir les caractéristiques physico-chimiques de XTEN, celui-ci a été couplé à un anti-

diabétique (Figure 1a) : L’exénatide. L’exénatide est une protéine agoniste du récepteur GLP-1

(peptide-1 de type glucagon). Dans l’organisme, l’exénatide augmente la production d’insuline et

permet donc de diminuer le taux de glucose dans le sang.

Pour démarrer, un SDS-PAGE en condition non réductrice a été réalisé afin d’observer la

pureté de E-XTEN après l’avoir produit chez E. coli (Figure 1b). L’exénatide fusionné à XTEN (E-XTEN)

a un poids moléculaire théorique de 84 kDa mais a migré à un poids moléculaire apparent de 160 kDa.

D’après ces données, E-XTEN semble non structuré et son rayon hydrodynamique semble entrainer

un ralentissement pendant la migration dans le gel. Cependant, la taille obtenue correspond à la taille

d’un potentiel dimère donc d’autres analyses ont été effectuées pour confirmer l’hypothèse des

auteurs.

Tout d’abord, E-XTEN a été analysé par dichroïsme circulaire (Figure 1c). Le spectre obtenu

est caractéristique d’une protéine non repliée. Il en a été déduit que E-XTEN est non structuré et qu’il

ne présente pas de structure secondaire.

E-XTEN a ensuite été analysé par spectrométrie de masse pour voir si l’échantillon est pur mais

aussi pour vérifier le poids moléculaire de la protéine de fusion (Figure 1d). Le spectre obtenu montre

trois pics correspondant à une protéine de 83 kDa chargée entre une et trois fois. Ces résultats

confirment la pureté de l’échantillon. Ils confirment aussi que le poids moléculaire de E-XTEN est bien

de 83 kDa.

Enfin, une analyse SEC-MALS (Chromatographie d’exclusion couplée à un détecteur de

diffusion de lumière multi-angle) a été réalisée pour comparer le rayon hydrodynamique de E-XTEN à

d’autres protéines possédant des rayons hydrodynamiques plus ou moins importants (Figure 1e). E-

XTEN est élué au départ, avant l’apoferritine qui est une protéine de 475 kDa. Le polypeptide XTEN a

donc un rayon hydrodynamique très important.


10

Figure 1 Production et caractérisation biophysique d’une protéine de fusion Exénatide-XTEN (E-XTEN). (a) Production d’une protéine médicament prototypique fusionnée à XTEN. Un gène codant pour une protéine médicament est fusionné à un gène codant pour XTEN et est placé sous la régulation d’un promoteur d’expression pour produire la construction complète chez E. coli. (b-e) Caractérisation biophysique de E-XTEN purifié et exprimé chez E.coli. La protéine purifiée a été analysée par SDS-PAGE (b), dichroïsme circulaire (c), spectrométrie de masse (d), et par chromatographie d’exclusion couplée à un détecteur de diffusion de lumière multi-angle (MALS, e). (b) SDS-PAGE non réducteur de E-XTEN purifié. Le premier puits contient un marqueur de taille. Le deuxième puits contient 2,5 µg de E-XTEN purifié. (c) Spectre de dichroïsme circulaire de E-XTEN obtenu à 25°C. (d) M+, M2+ et M3+ représentent les ions parents de E-XTEN chargé une fois, deux fois, et trois fois. (e)E-XTEN et des protéines standards sont toutes sujets indépendamment à des expériences successives de SEC-MALLS. Les résultats sont superposés pour faciliter la comparaison. Poids moléculaire attendu pour chaque protéine de référence : BSA, 66 kDa; aldolase, 155 kDa; apoferritin, 475 kDa.


11

2) XTEN : Immunogénicité

Après avoir caractérisé E-XTEN, les auteurs se sont penchés sur l’immunogénicité que le

polypeptide était susceptible de déclencher. Pour ce faire, la première procédure a été de mettre en

place des groupes de 3 souris puis d’injecter un antigène par groupe parmi 3 antigènes, en présence

ou non d’adjuvant de Freund :

E-XTEN ;

E-PEG40 (Exénatide couplé à PEG40), PEG40 étant un polyéthylène glycol validé cliniquement

et utilisé pour augmenter la durée de demi-vie de l’exénatide ;

ELSPAR (L-asparaginase), il s’agit d’une molécule capable d’engendrer une réponse

immunaitaire importante, c’est donc un contrôle positif d’immunogénicité.

Après 11 injections à 2 jours d’intervalle, le sang des souris a été prélevé et centrifugé dans le

but de récupérer le plasma contenant les anticorps. Une fois le plasma récupéré, plusieurs ELISA

indirectes ont été effectués. En effet, les antigènes ont été d’abord immobilisés dans les puits avant

de faire passer le plasma contenant potentiellement des anticorps contre ces mêmes antigènes. Par

la suite, les expérimentateurs ont ajouté des anticorps secondaires anti-IgG de souris couplés à la

peroxydase de raifort (HRP) pour ensuite révéler en utilisant l’ABTS (acide 2,2'-azino-bis(3-

éthylbenzothiazoline-6-sulphonique), substrat de la HRP). Les résultats sont reportés dans la table 1.

Ainsi, E-XTEN présente une immunogénicité non détectable par rapport au blanc, aussi bien en

absence qu’en présence d’adjuvant. En revanche, E-PEG40 présente une souris sérum positive en

présence d’adjuvant indiquant ainsi que E-XTEN est, non seulement moins immunogène que E-PEG40,

mais aussi qu’il ne présente pas une immunogénicité détectable dans ce test.

Pour confirmer ces résultats, les auteurs ont décidé de réaliser une expérience similaire mais

cette fois sur 20 souris au total (Figure 2). Encore une fois, les échantillons de plasma ont été analysés

pour leur présence d’anticorps contre E-XTEN ou l’exénatide seul. Sur la figure 2A, 10 animaux sur 20

ont montré un titre détectable d’anticorps contre E-XTEN (défini comme un signal deux fois plus

important du dosage terminal en comparaison avec le pré-saigné, ce dernier correspondant à

l’échantillon de sérum récupéré avant injection de l’antigène) pour une dilution de 1 :100. Pour une

dilution de 1 :500 (Figure 2B), seulement 5 souris sont sérum positives en se basant sur ce critère de

détermination. Par la suite, pour déterminer le titre spécifique à l’exénatide, une dilution à 1 :500 a

été réalisée et 2 des 5 animaux ont été décrétés sérum positifs pour des anticorps contre l’exénatide.

L’ensemble de ces résultats indique que E-XTEN présente une immunogénicité faible,

notamment en comparaison avec PEG-40, qui est validée cliniquement.


12

Table 1 Immunogénicité de E-XTEN en présence et en absence d’adjuvant. Trois antigènes ont été testés pour la présence d’anticorps les ciblant : E-XTEN, E-PPEG40 et ELSPAR. Une souris est dite sérum positive si les IgG contre l’antigène a donné un signal deux fois plus important que le signal du blanc (background). Le titre constitue la dilution du sérum maximale moyenne donnant une réponse positive en ELISA au moins deux fois plus importante que le background.

Figure 2 E-XTEN a une faible incidence sur l’immunogénicité chez les souris. En bleu : plasma avant injection de l’antigène,

jaune : plasma récupéré à la 5ème semaine de traitement, rouge : plasma récupéré après 7 semaines de traitement. En

ordonnée est présenté la densité optique mesurée après révélation de l’ELISA ; En abscisse est représenté chaque souris (20

au total). Les données sont présentées pour des dilutions à 1 :100ème (A) et 1 :500ème (B et C).


13

3) XTEN & durée de demi-vie des protéines recombinantes

Pour finir, les auteurs se sont intéressés aux paramètres pharmacologiques de E-XTEN : durée

de demi-vie, biodisponibilité, volume de distribution et clairance.

Tout d’abord, ils ont déterminé la durée de demi-vie de E-XTEN. Pour ce faire, des singes

cynomolgus ont été traités avec une dose de 1mg/kg de E-XTEN par administration en sous-cutanée

et intraveineux. Les expérimentateurs ont mesuré les concentrations plasmatiques de E-XTEN à

différents temps pendant 350 heures. La première observation qui découle des résultats est le fait

que la phase d’absorption de E-XTEN injecté en sous-cutanée est lente (entre 24 et 48h, figure 3a).

Par comparaison, l’exénatide seul et les principes actifs en général injectés en sous-cutanée

présentent des phases d’absorption plus rapides, par exemple plusieurs heures seulement pour

l’exénatide seul. De plus, après avoir atteint une concentration plasmatique maximale à 48h, celle-ci

reste à peu près stable jusqu’à 100h, en sous-cutanée. Ceci est une caractéristique intéressante de E-

XTEN puisqu’il réside longtemps dans l’organisme des singes traités dans cette étude. Après 100h, une

diminution graduelle de la concentration plasmatique de E-XTEN est observée, et ceci jusqu’à la fin

des mesures. Dans ces conditions, la durée de demi-vie de E-XTEN a été calculée comme étant de 60h.

Cette valeur est beaucoup plus importante que l’exénatide seul, qui lui n’est disponible que quelques

heures dans le sang. La biodisponibilité a été aussi déterminée. Elle s’avère être de 80%, E-XTEN

présente donc des caractéristiques pharmacologiques intéressantes.

Malgré tout, un élément important est à prendre en compte : l’activité de E-XTEN. En effet,

ces bonnes caractéristiques pharmacologiques ne suffisent pas à elles-mêmes à conclure de

l’efficacité de XTEN. Ce dernier ne doit pas entraver l’activité de l’exénatide auquel il est fusionné.

L’exénatide permet de diminuer le taux de glucagon. Le glucagon va à son tour augmenter le taux

d’insuline et par conséquent réduire la concentration en glucose dans le sang. Pour évaluer l’activité

de E-XTEN, des souris à jeun ont été traitées avec un placebo, l’exénatide seul ou bien encore E-XTEN.

Ces injections sont effectuées 48h avant une administration en glucose. Le but est de comparer

l’efficacité de l’exénatide seul et celle de E-XTEN. Après cette administration, les concentrations

plasmatiques en glucose seront mesurées toutes les deux heures. Les résultats de cette expérience

sont présentés sur la figure 3b. En traitant les souris avec le placebo ou l’exénatide seul, on observe

une concentration en glucose qui augmente rapidement après l’administration en glucose. Celle-ci

reste assez constante, avec toutefois une diminution à partir de 60 minutes. Ces observations sont

dues au fait que le placebo et l’exénatide (t1/2 = 0.17h chez les souris) sont rapidement éliminés. En

revanche, dans le cas de E-XTEN, celui-ci ne semble pas être éliminé par les souris. En effet, la


14

Figure 3 Caractérisation in vivo de E-XTEN. (a) Profil pharmacocinétique de 1mg/kg de E-XTEN injecté par voie intraveineuse ou sous-cutanée chez des singes Cynomolgus. Les points représentent la moyenne (± déviation standard) de chaque groupe composé de 3 singes. (b) Efficacité in vivo de E-XTEN chez des souris normales. Les points représentent la moyenne (± déviation standard) de chaque groupe composé de 6 souris. 48 heures avant le test de résistance au glucose, les animaux ont reçu une injection péritonéale de placebo, 10 µg exenatide ou 250 µg E-XTEN (équivalent molaire). Le moment où le glucose est injecté est marqué par une flèche. Le taux de sucre dans le sang a été testé avec un glucomètre pendant 2 heures. Les points marqués avec un astérisque correspondent à des taux de sucre dans le sang qui sont significativement différents par rapport au groupe placebo.


15

concentration de E-XTEN dans le plasma n’augmente que très légèrement après administration du

glucose et reste plutôt stable par la suite.

Finalement, les auteurs ont utilisé les mesures pharmacologiques de E-XTEN tirées d’autres

modèles animaux pour établir des échelles allométriques en fonction du poids pour prédire les

paramètres pharmacologiques de E-XTEN chez l’homme. Ces résultats sont présentés sur la figure 4.

Il est ainsi possible de prédire que E-XTEN aura chez l’homme une durée de demi-vie de 139h, avec

une clairance de 30 mL/h et un volume de distribution de 5.970 mL.

Pour conclure sur cette publication, il a été montré que XTEN est une protéine de fusion

efficace pour améliorer la durée de demi-vie des protéines médicaments. De plus, ce polypeptide est

non immunogène, simple à produire, très soluble mais aussi biodégradable. Il serait cependant

nécessaire de réaliser d’autres études plus approfondies, notamment concernant la manière dont

XTEN arrive à « protéger » l’exénatide afin d’empêcher que ce dernier soit éliminé, tout en conservant

son activité. Dans l’article, ils présentent cela comme étant le « bulking effect », c’est-à-dire le fait que

XTEN aura tendance à entourer l’exénatide, grâce à sa grande taille, sa flexibilité et sa solubilité.

Néanmoins, cette étude a été publiée en 2009 et entre temps, plusieurs articles impliquant XTEN ont

été publiés avec des données plus précises sur ce polypeptide, mais ne donnant pas plus

d’informations sur ce « bulking effect ». Aussi, plusieurs médicaments utilisant la technologie XTEN

sont en phases précliniques ou cliniques, le plus avancé étant en phase 3. Cette technologie semble

donc fonctionner. La méthode de conception de XTEN ainsi que ce « bulking effect » nous ont

notamment intéressés pour une tout autre application que nous allons vous présenter dans la suite

de ce rapport.


16

Figure 4 Echelles allométriques des paramètres pharmacocinétiques de E-XTEN chez l’humain obtenus à partir de 4 espèces différentes. (a-c) Echelle allométrique du temps de demi-vie de E-XTEN (a), clairance (b) et volume de distribution (c). Les points pour chaque espèce (carrés pleins) sont marqués de façon que : M, souris (0.025 kg); R, rat (0.25 kg); C, singe cynomolgus (5 kg); D, chien (beagle; 12 kg). La prédiction a été réalisé à partir d’un ajustement linéaire des données (Hpred, carré claire). Les valeurs humaines prédites pour chaque paramètre sont affichées sur chaque point, le R² est affiché sur chaque ajustement linéaire. Le temps de demi-vie chez l’Homme peut également être estimé grâce à la valeur prédictive de la clairance(CI) et le volume de distribution (Vd) de façon à ce qu’elle soit égale à 0.693 × Vd/Cl. L'application de cette formule donne une demi-vie prédite de 139 h chez l'homme, ce qui concorde avec l'extrapolation linéaire.


17

Introduction : Vers une étiquette d’expression innovante

Plusieurs caractéristiques de XTEN sont intéressantes. Ce dernier est d’abord de taille

importante par rapport à la taille de la protéine à laquelle il est fusionné. Il est aussi très facile à

produire chez E. coli mais aussi très soluble, ce qui conduit XTEN à une stabilité accrue. Cette solubilité

importante est due à sa structure primaire. XTEN est composé uniquement d’acides aminés qui

tendent à augmenter la solubilité des protéines. Enfin, il est non structuré, il ne possède pas de

structures secondaires et est donc très flexible, c’est ce qui permet ce fameux « bulking effect » et

donc la tendance que le polypeptide aura à entourer et « protéger » la protéine à laquelle celui-ci est

fusionné. L’ensemble de ces aspects nous ont tout de suite parus comme étant des caractéristiques

très pertinentes pour un tag d’expression. Cependant, malgré que l’idée soit très intéressante, de

nombreuses informations devaient être vérifiées. Ainsi, le but de cette introduction est de déterminer

si concevoir une étiquette d’expression similaire à XTEN est convaincant.

1) Production de protéines recombinantes chez E. coli : Les limites

Jusqu’à récemment, pour produire des protéines médicaments, la tendance s’orientait plutôt

vers les systèmes eucaryotes supérieurs. Avant cela, les systèmes bactériens et notamment E. coli

étaient les systèmes de choix. Ceci est notamment dû au fait que la biomasse obtenue en utilisant E.

coli est extrêmement importante. Malgré que les systèmes eucaryotes supérieurs soient privilégiés,

la tendance est en train de revenir vers E. coli car de nouvelles souches voient le jour. Par exemple, la

souche ClearColi BL21 (DE3) de Lucigen permet d’éliminer les endotoxines à la source. En effet,

l’absence d’endotoxines est critique pour les protéines médicaments. Certaines souches de E. coli ont

aussi été améliorées pour permettre de faire des modifications post-traductionnelles. À titre

d’exemple, les auteurs d’une publication parue en 2015 dans Nature Communications ont réussi à

produire des anticorps entiers dans le cytoplasme d’E. coli (3). Pour ce faire, une souche améliorée

d’E. coli appelée SHuffle a été utilisée. Cette souche permet notamment la formation correcte de

ponts disulfures dans le cytoplasme d’E. coli. L’ensemble de ces informations nous amènent plutôt à

nous intéresser au système E. coli plutôt que les autres systèmes. Plusieurs autres éléments nous ont

conduits à ce choix, nous les détaillerons au fur et à mesure dans cette introduction.

Tout d’abord, il est important de préciser que des études précédentes (4) (5) ont montré que

75% des protéines humaines ont pu être exprimées chez E. coli, avec toutefois seulement 25% de

protéines produites sous forme soluble et active. En effet, exprimer des protéines chez E. coli

représente un défi considérable. Le problème le plus souvent rencontré est l’agrégation. Le milieu peu


18


19

oxydant dans le cytoplasme de E. coli n’est pas favorable à la formation normale de ponts disulfures.

Ceci va souvent conduire à un mauvais repliement de la protéine recombinante. Le mauvais

repliement de la protéine recombinante va à son tour contribuer à l’agrégation. Ainsi, lorsque des

protéines recombinantes sont surexprimées dans le cytoplasme d’E. coli, des corps d’inclusion

peuvent se former (6). Il y a toujours un équilibre entre la forme native d’une protéine (correctement

repliée), la forme intermediaire (pas complètement repliée) et la forme non repliée. Il y a aussi un

équilibre entre la forme intermediaire et la forme agrégée, cet équilibre étant fortement dirigée vers

la formation d’agrégats (7) (figure 5).

Pour pallier au problème d’agrégation, plusieurs solutions sont à disposition. La solubilisation

des corps d’inclusion après production s’avère être une solution efficace pour les petites protéines et

les peptides. Il existe même des étiquettes qui permettent de faire produire les protéines d’intérêt

sous forme de corps d’inclusion. En effet, dans ce cas, la quantité de corps d’inclusion obtenue est

souvent très importante et il est possible de récupérer un certain pourcentage de protéines sous

forme soluble, ce pourcentage étant souvent variable selon les cas (8). Cependant, cette méthode a

tendance à être rentable uniquement pour les petites protéines. De plus, il est souvent difficile

d’obtenir un rendement correct en solubilisant les corps d’inclusion. Ainsi, pour éviter la formation

d’agrégats, il est possible de fusionner une étiquette dite d’expression (ou de solubilité) à la protéine

d’intérêt. Cette étiquette va notamment permettre d’éviter la formation d’agrégats par différents

mécanismes selon le type d’étiquette utilisé.


20

Figure 5 Equilibre entre les formes natives, intermédiaires, non repliées et agrégées. N : forme native, I : forme intermédiaire, U : forme non repliée, A : forme agrégée (agrégats). L’équilibre entre I et A est fortement biaisé vers A, comme le montre la flèche I -> A de taille plus importante que A -> I.


21

2) Les étiquettes d’expression actuelles et leur(s) mécanisme(s)

Pour surmonter l’agrégation des protéines recombinantes, les étiquettes d’expression sont

extrêmement utilisées de par leur efficacité et leur facilité d’utilisation. D’après (9), à l’heure

d’aujourd’hui, les mécanismes par lesquels les étiquettes de fusion améliorent la solubilité des

protéines recombinantes ne sont pas précisément connus. Néanmoins, plusieurs hypothèses sont

suggérées :

1) Les protéines de fusion forment des structures de type micelle : Les protéines mal repliées ou

non repliées vont être séquestrées et protégées du solvant. Aussi, le domaine soluble de la

protéine sera orienté vers l’extérieur et donc le domaine insoluble sera lui plutôt orienté vers

l’intérieur.

2) Les partenaires de fusion attirent des chaperones : L’étiquette de fusion conduit la protéine

d’intérêt dans une voie de repliement impliquant une ou plusieurs chaperones. Les étiquettes

de solubilité MBP (Maltose-binding protein) et NusA (N-utilization substance) sont deux

protéines de fusion qui utilisent ce mécanisme. Elles sont notamment connues pour interagir

avec GroEL, une chaperone présente chez E. coli (10) (11).

3) Les partenaires de fusion ont une activité intrinsèque type chaperone : Les domaines

hydrophobes de l’étiquette interagissent avec la protéine d’intérêt repliée partiellement,

empêchant ainsi l’auto-agrégation ou encore l’agrégation avec d’autres protéines. Ce

mécanisme permet ainsi le bon repliement de la protéine recombinante. Dans ce cas,

l’étiquette de fusion joue un rôle passif dans le repliement de la protéine d’intérêt, réduisant

ainsi la probabilité que la protéine s’agrège. La MBP en est un exemple, elle rentre donc dans

la catégorie 2 mais aussi dans celle-ci (12). Il est cependant difficile de faire la différence la

catégorie 2 et la catégorie 3.

4) La charge nette des protéines de fusion : Les partenaires de fusion très acides peuvent inhiber

l’agrégation protéique par répulsion électrostatique (13).

Les mécanismes que présentent les étiquettes d’expression sont donc plutôt mal connus.

Parmi le nombre important d’étiquettes qui existent à l’heure d’aujourd’hui, les plus utilisées sont

répertoriées sur la table 2, cette dernière est issue de (14). Les tailles de MBP et NusA sont

particulièrement percutantes, elles sont de 396 et 495 acides aminés respectivement. La taille de XTEN

est de 876 acides aminés, elle se rapproche donc assez bien des tailles de MBP et NusA. Le troisième

élément intéressant à remarquer est le SET (Solubility enhancing tag) ou SEP (Solubility enhancing

peptide). Les SET/SEP sont des petits peptides de moins de 20 acides aminés extrêmement solubles

et permettant d’augmenter la solubilité des protéines recombinantes, notamment grâce à leur


22

Table 2 Les étiquettes d’expression et de solubilité les plus utilisées à l’heure actuelle. Le nom de l’étiquette, la taille de celle-ci ainsi que le nom de la protéine associée sont répertoriés sur ce tableau. MBP, NusA et SET (encadrées en rouge) sont des étiquettes intéressantes pour le projet que nous souhaitons mettre au point.


23

structure primaire. Cette caractéristique se rapproche assez bien de la structure primaire de XTEN, qui

justement va tendre vers une solubilité importante.

Parmi les différentes étiquettes, MBP s’avère notamment très efficace, notamment lorsque

comparé avec les étiquettes Trx (Thioredoxine) et GST (Glutathion S-transférase), cette dernière étant

utilisée pour l’expression et la purification. Ces résultats sont issus de (15) et sont présentés sur la

figure 6. Les protéines utilisées dans cette étude (TIMP, p16, E6 etc.) sont des protéines de référence

utilisées pour comparer l’efficacité des étiquettes d’expression. Malgré que l’expression de protéines

recombinantes relève toujours du cas par cas, il est quand même possible de comparer différentes

étiquettes et d’en déduire la plus efficace de manière générale. De plus, il n’existe pas d’étiquette

universelle qui fonctionne pour toutes les protéines. Ainsi, lorsqu’une étiquette est conçue, de telles

comparaisons sont toujours effectuées et il s’agit donc d’un passage obligé si l’on souhaite développer

une étiquette de type XTEN.

3) DnaK : une chaperone d’importance majeure chez E. coli

L’alternative, ou plutôt le complément à l’utilisation d’étiquettes d’expression, se présente

comme étant la co-expression de chaperones. D’après (16), les chaperones sont des protéines

assurant le bon repliement des autres protéines. Elles « protègent » les protéines contre l’agrégation

et s’assurent de dégrader les protéines mal repliées. Il existe différents types de chaperones chez E.

coli. Les plus connues et étudiées sont les chaperones de classe HSP60 et HSP70 (Heat shock-protein

60 et 70). GroEL est la HSP60 de E. coli, elle agit au niveau du repliement des protéines en créant une

cavité, les isolant ainsi du milieu extérieur. Néanmoins, la chaperone la plus importante chez E. coli

est DnaK, il s’agit de la HSP70 de E. coli. Elle permet le bon déploiement des protéines, agit sur la

désagrégation ainsi que sur le repliement. Sur la figure 7 adaptée de (17), il est possible d’observer

l’impact significatif de DnaK sur le bon repliement des protéines chez E. coli. Pour tester le niveau de

repliement des protéines en présence ou en absence de chaperone, 4 MBP reliées entre elles ont été

produites chez E. coli. Ces MBP ont ensuite été purifiées, biotinylées et fixées à des billes. Par la suite,

ces MBP ont été analysées en présence ou en absence de DnaK, et ceci par pince optique (ou optical

tweezers assay, en anglais). Cette technique consiste à étirer la construction (les 4 MBP) en appliquant

une force sur les billes. Enfin, à l’aide de calculs complexes, il est possible de déterminer l’état de

repliement des MBP. En effet, plus une protéine est repliée de manière correcte, plus celle-ci sera

difficile à déstabiliser et donc à linéariser. L’étude (17) montre donc que DnaK inhibe l’agrégation et

favorise le repliement des protéines chez E. coli. Le mécanisme derrière cette inhibition de l’agrégation

par DnaK est dû à son fort rayon hydrodynamique (18). Si malgré tout, DnaK ne parvient pas à


24

Figure 6 Solubilité des protéines de fusion TRX, GST et MBP en fonction de la protéine d’intérêt fusionnée à une des étiquettes utilisées (TIMP, p16, E6, CATΔ9, GFP, TEV). La solubilité de chaque protéine de fusion a été estimée grâce aux données que les auteurs de cette étude ont obtenues par quantification des bandes issues de gels SDS-PAGE (quantification par densitométrie). MBP : Maltose-binding protein, GST: Glutathion S-transferase, TRX : Thioredoxin, TIMP : Metallopeptidase inhibitor, p16 : Cyclin-dependent kinase inhibitor 2A, E6 : Human Papillomavirus (HPV) E6 protein, CATΔ9 : Chloramphenicol acetyl transferase, GFP : Green fluorescent protein, TEV : Tobacco etch virus protease.

Figure 7 DnaK empêche l’agrégation et permet le repliement correct des protéines. Les fractions de protéines dans un état natif, intermédiaire, faiblement replié ou fortement replié en absence ou en présence de DnaK sont représentées sur cette figure.


25

permettre le bon repliement d’une protéine, elle a quand même la capacité à transférer cette même

protéine à GroEL, l’autre chaperone majeure de E. coli (19).

DnaK a suscité fortement notre intérêt. Chez E. coli, il s’agit d’un acteur majeur dans la

production de protéines recombinantes. Nous nous sommes donc intéressés sur le motif qui permet

le recrutement de DnaK. Dans une étude publiée en 1997 dans Nature Structural & Molecular Biology

(20), une équipe a récupéré des données d’une étude ayant criblé une librairie de peptides pour leur

interaction avec DnaK, ceci en utilisant le phage display. Cette librairie de peptides provient de

protéines connues pour interagir avec DnaK. À l’aide de ces données, l’équipe a établi un consensus

d’une séquence type de 13 acides aminés capable de se fixer à DnaK. Les données associées à ces

résultats sont représentées sur la figure 8.

Sur la figure 8, il est notamment intéressant de constater que le cœur hydrophobe qui

compose les peptides interagissant avec DnaK est dans beaucoup de cas constitué d’isoleucine,

leucine, valine ainsi que la tyrosine. Autour de ce cœur hydrophobes, des régions comprenant

uniquement des acides aminés basiques semblent importantes.

Depuis ces recherches concernant DnaK, il n’y a pas eu plus de précisions concernant une

région précise qui permet l’interaction avec DnaK. Néanmoins, en utilisant ce consensus, déterminer

une séquence qui interagit avec DnaK devrait être relativement simple.

En réunissant l’ensemble des données que nous avons obtenues, on peut imaginer un projet

pertinent impliquant un polypeptide type XTEN ainsi que DnaK.

4) Notre projet

Pour notre projet, nous souhaitons développer un long polypeptide type XTEN. Néanmoins, le

but n’est pas d’améliorer la durée de demi-vie de protéines médicaments. En effet, il serait plutôt

d’augmenter la solubilité des protéines recombinantes en utilisant un tel polypeptide en tant

qu’étiquette d’expression. Nous avons en effet vu que XTEN est simple à produire et soluble. Pour

continuer, d’après (9), la solubilité d’une protéine recombinante peut être améliorée en fusionnant à

celle-ci une protéine extrêmement soluble. C’est le cas de MBP et NusA qui vont jouer des rôles de

type chaperone. XTEN possède aussi ce fameux « bulking effect » qui permet de recouvrir la protéine

à laquelle il est fusionné. Ce « bulking effect » est notamment dû à la structure primaire de XTEN et à

sa taille. Dans notre cas, la caractéristique qui changerait serait la structure primaire puisque pour

XTEN, la composition en acides aminés a été déterminée en fonction de plusieurs paramètres

spécifiques des protéines médicaments (immunogénicité par exemple).


26

Figure 8 Pourcentage d’acides aminés contenu dans les peptides interagissant avec DnaK. a, Le motif qui permet la liaison avec DnaK consiste en un cœur comprenant 5 acides aminés hydrophobes et/ou aromatiques (Hy) et des régions flanquantes enrichies en acides aminés basiques (+). En revanche, plus la distance en partant du cœur hydrophobe est importante, moins l’incidence des résidus basiques sera importante. b, distribution en acides aminés (%) au sein des cœurs hydrophobes de 90 peptides interagissant avec DnaK (bars noires) comparée à la distribution moyenne au sein de la libraire entière utilisée pour cette étude (bars blanches).


27

Nous avons aussi vu que DnaK est une chaperone déterminante chez E. coli. Sa présence joue

un rôle extrêmement important sur le repliement des protéines. De plus, une séquence de seulement

15 acides aminés est primordiale pour recruter DnaK. L’ajouter sur un tel polypeptide donnerait un

aspect supplémentaire intéressant pour une étiquette d’expression. En effet, malgré que la solubilité

et le repliement soient des caractéristiques intimement proches, ils ne sont pas directement reliés. Il

faut donc agir sur ces deux aspects pour permettre de produire une protéine soluble et correctement

repliée. Ajouter une séquence de reconnaissance de DnaK serait donc un atout majeur.

L’intérêt double du polypeptide (qui jouerait donc un rôle de type chaperone) et de DnaK

pourrait permettre la conception d’une étiquette d’expression efficace, mais surtout universelle. De

façon schématique, notre construction se présenterait comme sur la figure 9.


28

Figure 9 Notre projet : Un polypeptide long et non structuré ayant un « bulking effect » protège la protéine de l’agrégation et permet donc une production de la protéine sous forme soluble. Une séquence recrutant DnaK et située proche de la protéine recombinante permet la fixation à DnaK, et donc le bon repliement de la protéine d’intérêt. Un linker permettrait de lier la protéine d’intérêt à la séquence reconnue par DnaK.


29

Conception de l’étiquette d’expression : DTEN

1) Structure primaire et taille de DTEN

En suivant la manière dont XTEN a été conçu, notre étiquette d’expression, qu’on nommera

DTEN, sera constituée d’une série de petites séquences peptidiques. Les acides aminés qui

composeront ces séquences seront choisis pour leur caractère soluble et pour assurer un haut niveau

d’expression de notre polypeptide. Nous devrons choisir :

Les acides aminés qui composeront notre peptide et qui vont lui conférer un maximum de

solubilité ;

Le rapport adéquat entre ces acides aminés dans toutes les petites séquences composant le

peptide final (le pourcentage de chacun des acides aminés choisis dans les séquences) ;

Le taille de ces petites séquences.

Sachant que le but de XTEN était de l’utiliser dans un contexte pharmacologique (1) (durée de

demi-vie des principes actifs), les acides aminés choisis pour sa construction ne seront donc pas

forcément adaptés pour notre DTEN.

Nous devrons alors établir une recherche bibliographique approfondie pour étudier le degré

de solubilité des acides aminés. Nous commencerons par exploiter les résultats d’une étude extensive

sur la solubilité de plusieurs acides aminés (21). Une deuxième étude a été effectuée pour classer les

acides aminés par leur degré de solubilité dans l’urée (22). Les auteurs justifient ce choix par la

contribution des groupements qui composent leurs chaines latérales. Un autre travail élaboré par les

mêmes auteurs a fourni une échelle d’hydrophobicité des acides aminés dans l’eau, l’éthanol et le

dioxane (23). Une autre étude plus récente (24) montre une méthode pour déterminer les paramètres

de la théorie statistique associée aux fluides (SAFT) pour les acides aminés.. Cette technique permet

de déterminer la solubilité de manière précise.

La deuxième méthode serait la détermination des acides aminés « solubles » à partir de la

composition en acides aminés des étiquettes de solubilité déjà utilisées. Etant donné que toutes ces

étiquettes sont issues de protéines naturelles, celles-ci contiennent forcément tous les acides aminés

naturels. Nous pourrions utiliser cette méthode pour déterminer la proportion des acides aminés les

plus abondants dans ces séquences peptidiques. On peut supposer que ces acides aminés confèrent

aux étiquettes naturelles utilisées (MBP par exemple) l’effet solubilisant sur les protéines

recombinantes fusionnées. Cela dit, il faudra vérifier que la proportion de ces acides aminés dans

toutes ces étiquettes est homogène pour confirmer leur exploitabilité. De plus, nous nous limiterons

aux 6-7 acides aminés les plus abondants pour ne pas compliquer la synthèse de la librairie de


30


31

séquences aléatoires que nous testerons par la suite (1). Une alternative plus simple serait de

déterminer la composition en acides aminés des étiquettes SET (25) ou SEP (26) connues pour

améliorer la solubilité et se baser sur celles-ci pour notre DTEN (cf introducton). Ce sont de petites

séquences peptidiques avec des caractéristiques physico-chimiques similaires. Leur taille varie de 1 à

6 acides aminés pour SEP et jusqu’à 56 acides aminés pour SET.

Il existe aussi des logiciels pouvant prédire la solubilité des peptides et des protéines. Un score

de solubilité est attribué pour chaque acide aminé et la solubilité de la protéine est obtenue en

calculant la somme des scores de tous les acides aminés qui la compose. Néanmoins, la solubilité

calculée n’inclut pas d’autres paramètres comme le pH et la température. Cet outil sera plutôt utilisé

pour avoir une idée des acides aminés impliquant des scores de solubilité élevés, mais aussi pour

vérifier qualitativement la solubilité de chacune des séquences composant notre peptide final.

Après avoir choisi les acides aminés qui vont constituer ces petites séquences peptidiques, il

faudra choisir leur taille. Des tentatives antérieures de construction de peptides de fusion non

structurés utilisant des répétitions penta peptidiques de 2-5 acides aminés ont montré une faible

solubilité de la protéine de fusion (27). Cela implique que des séquences plus longues sont nécessaires

pour obtenir des polymères longs avec une bonne solubilité. Pour la synthèse de XTEN, les auteurs

ont choisi de commencer par des séquences de 36 acides aminés (108 nucléotides). Ceux-ci étaient

composées de manière aléatoire avec les acides aminés que l’équipe a choisis. Ce choix leur a permis

d’obtenir un polypeptide final non structuré et ayant une excellente solubilité (1). Nous allons donc

choisir cette taille pour les séquences qui composeront notre peptide final.

Comme nous l’avons déjà évoqué, nous pourrons utiliser des logiciels de prédiction de

solubilité pour déterminer la proportion d’acides aminés dans nos séquences qui composeront notre

peptide final. Ils seront sélectionnés afin obtenir un maximum de solubilité tout en maintenant une

charge globale du peptide négative. En effet, il a été montré que les extensions peptidiques avec une

charge négative inhibe l’agrégation plus facilement (28).

2) DTEN et Immunogénicité

Finalement, la structure primaire choisie doit aussi dépendre du but final de DTEN, notre

polypeptide de fusion. Quel que soit la protéine recombinante produite, elle servira soit à la recherche

(production de protéines recombinantes de manière général) ou soit à des fins thérapeutiques (fusion

à des protéines médicaments). Dans le cas d’une protéine injectée à un patient, il est possible que

nous soyons obligés de garder notre polypeptide en fusion avec la protéine recombinante. Il faudra

alors déterminer si notre polypeptide est immunogène ou non. Sa composition en acides aminés sera


32


33

alors déterminante, puisqu’il a été montré que les acides aminés hydrophobes, par exemple, sont des

motifs reconnus par le complexe d’histocompatibilité majeure (MHC) de classe II (2). Nous avons choisi

alors de ne pas prendre en compte ce critère dans le choix d’acides aminés. Nous testerons l’effet

immunogène de notre polypeptide final plus tard et déterminerons si notre construction pourra servir

pour la production de protéines médicaments ou non.

4) Construction plasmidique

Nous avons choisi de construire un polypeptide de taille finale proche de 504 acides aminés

(proche de la taille d’autres protéines de fusion améliorant la solubilité comme MBP et NusA). Celui-

ci sera le produit d’assemblage de plusieurs petites séquences avec entre chacune d’elles des sites

restriction. Cela donnera une plus grande flexibilité sur la taille du polypeptide de fusion (figure 10).

DTEN sera en C-terminal (C-ter) de la protéine de fusion. Les deux seront séparés par un site de clivage

à la thrombine. Cela permettra de se débarrasser du polypeptide. En N-terminal (N-ter), nous allons

placer la séquence de recrutement de la chaperonne DnaK avec une étiquette poly-histidine pour la

purification. Un site de clivage du Tobacco Etch Virus (TEV) permettra d’obtenir la protéine de fusion

séparée de l’étiquette poly-histidine.

Nous avons choisi de positionner la séquence de recrutement de chaperonne en N-ter pour

garder un contact direct avec la protéine à produire. Ceci permettra de faciliter son repliement. Nous

avons aussi choisi de mettre DTEN en C-ter car on s’attend à ce que le peptide augmente la solubilité

en créant un effet de recouvrement (« bulking effect »). Il entourerait la protéine et empêcherait son

interaction avec d’autres protéines dans le cytoplasme. Par contre, bien évidemment, DTEN n’a

aucune affinité spécifique pour sa protéine conjuguée. Par conséquent, s’il est traduit avant la

protéine de fusion, rien ne l’empêchera d’interagir avec d’autres protéines du cytoplasme avant que

la protéine conjuguée ne soit traduite, c’est la raison pour laquelle nous placerons DTEN en C-ter.


34

Figure 10 Modèle de vecteur de clonage et d’expression pouvant être utilisé pour exprimer DTEN avec une protéine d’intérêt. Lac I : Séquence de répression de transcription de l’opérateur Lac, Ori : Origine de réplication de E. coli. F1 ori : origine de réplication de phage, * : Sites de restriction différents de ceux présents dans le site de clonage multiple, TEV : Tobacco etch virus, His-Tag : Etiquette poly-histidine.


35

DTEN et DnaK : Solubilité & repliement

1) Criblage d’une banque de peptides interagissant potentiellement avec DnaK

Dans l’introduction, nous avons souligné l’importance de la chaperone DnaK pour le bon

repliement des protéines chez E. coli. Aussi, comme décrit précédemment, (20) a montré qu’un

consensus de 13 acides aminés représente le motif interagissant avec DnaK (figure 8). Ce motif est

composé de 5 acides aminés hydrophobes et/ou aromatiques au centre de la séquence peptidique,

avec des régions flanquées chargées positivement. Néanmoins, pour DTEN, il n’est pas possible

d’inclure une séquence quelconque en suivant ce consensus de manière arbitraire. En effet, nous

pensons qu’il est nécessaire avant tout de cribler une banque de peptides qui intègre ce consensus

pour pouvoir choisir une séquence peptidique précise. Pour cribler une telle banque, il est possible de

générer informatiquement toutes les séquences peptidiques qui rentrent dans ce consensus. En

fonction du nombre de séquences obtenu, le criblage de toute la banque ou seulement d’une certaine

partie de celle-ci (dans le cas où la banque est trop importante) pourra se faire. Une fois la banque

générée informatiquement, la technique de choix pour une telle expérience serait le phage display.

Cette méthode est adaptée au nombre important de candidats à cribler (les peptides). De plus, elle

est très utilisée pour cribler des peptides ou des petites protéines. Elle est aussi plutôt facile à mettre

en place et peu couteuse. Le double hybride serait aussi intéressant mais plus difficile à mettre en

place, plus chère et n’est pas approprié pour étudier des interactions qui impliquent des peptides.

Ainsi, en immobilisant DnaK, il est possible de cribler les peptides qui interagissent le mieux avec la

chaperone. De cette manière, par effet entonnoir, il est possible de remonter à un faible nombre de

peptides interagissant correctement avec DnaK. Malgré tout, le phage display ne se suffit pas à lui-

même pour conclure d’une interaction protéine-protéine. De plus, le peptide n’inclut pas DTEN. En

effet, il est probable que DTEN puisse empêcher l’interaction entre DnaK et les peptides candidats.

2) Etude de l’interaction entre DTEN et DnaK

Après avoir ajouté la séquence de reconnaissance DnaK à DTEN, il faut vérifier que le

polypeptide se fixe à DnaK. Pour ce faire, il est possible de produire cette dernière et DTEN

indépendamment. DnaK peut aussi être achetée directement, chez Enzo Life Sciences par exemple.

Une fois les deux protéines obtenues, une co-immunoprécipitation peut être réalisée avec un

anticorps ciblant DnaK. De cette manière, l’interaction entre DTEN et DnaK sera vérifiée. Si le résultat

s’avère positif, une vérification supplémentaire s’impose pour une démarche scientifique rigoureuse.


36


37

Ainsi, en produisant DTEN dans des bactéries E. coli exprimant DnaK (expression basale, pas de

surexpression), il est possible d’effectuer un pull-down pour vérifier que l’interaction entre les deux

acteurs se fasse. Pour ceci, il faut ajouter une étiquette de purification telle que la GST (affinité pour

le gluthation) à DTEN. Après le pull-down, un simple gel Western Blot est suffisant pour voir si les deux

protéines interagissent, de par les tailles qu’il sera possible d’observer. Ainsi, en procédant avec les

contrôles suivants, il sera possible de valider l’interaction :

Contrôle 1 : Pas de surexpression de DTEN ; Expression basale de DnaK

Contrôle 2 : Surexpression de DTEN ; Knock-out de DnaK (par CRISPR-Cas9 par exemple)

Contrôle 3 : Surexpression du peptide interagissant avec DnaK et contenant la GST ;

Expression basale de DnaK

Contrôle 4 : Surexpression de DTEN sans la séquence de reconnaissance DnaK et ; Expression

basale de DnaK

Criblage & caractérisation de DTEN

1) Méthode de criblage

Après avoir choisi 500 fragments peptidiques de 108 nucléotides chacun, nous réaliserons un

criblage dans le but de sélectionner les séquences les mieux exprimées et les plus solubles. Pour ce

faire, nous allons les coupler à la GFP. Chaque séquence sera surexprimée chez E. coli BL21 (DE3),

souche très utilisée pour la surexpression de protéines recombinantes. Grâce à la GFP, il sera possible

de quantifier la fluorescence associée à chacune des constructions. Cette méthode a été utilisée pour

XTEN (1) et permet de sélectionner les fragments les plus exprimés en comparant la fluorescence

émise par chaque construction. Les cultures associées pourront être réalisées dans des plaques 96

puits, en adaptant le matériel à cette méthode haut débit (centrifugeuse notamment). D’autres études

comme (29) ont réalisé des criblages similaires. Pour tester la solubilité de ces fragments, nous

lyserons les bactéries avant de centrifuger le lysat. Le surnagent contenant la fraction soluble sera

récupérée. Le culot contenant les protéines insolubles sera resuspendu dans de l’urée. Les deux

fractions de chaque échantillon (soluble et insoluble) seront alors analysées par SDS-PAGE afin d’avoir

une estimation de la quantité de protéines produite sous forme soluble par des mesures de

densitométrie. Nous pourrons alors estimer le pourcentage de solubilité de notre construction grâce

à l’équation suivante :

%Solubilité =(𝑄𝑢𝑎𝑛𝑡𝑖𝑡é 𝑑𝑒 𝑝𝑟𝑜𝑡é𝑖𝑛𝑒𝑠 𝑑𝑎𝑛𝑠 𝑙𝑎 𝑓𝑟𝑎𝑐𝑡𝑖𝑜𝑛 𝑠𝑜𝑙𝑢𝑏𝑙𝑒)

𝑄𝑢𝑎𝑛𝑡𝑖𝑡é 𝑑𝑒 𝑝𝑟𝑜𝑡é𝑖𝑛𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒 𝑋 100


38


39

Nous retiendrons alors les 100 séquences les plus exprimées et les 100 séquences les plus

solubles. Nous comparerons ces séquences et choisirons les 4 séquences comportant les meilleurs

taux de solubilité et d’expression. Ces 4 séquences seront ensuite combinées de manière aléatoire par

bio-informatique pour obtenir 50 fragments de 504 acides aminés (multiple de 36). Nous avons choisi

cette taille de 504 acides aminés car elle se rapproche assez bien des tailles de MBP et NusA (396 et

495 acides aminés respectivement). Nous commanderons ensuite directement les séquences, par

exemple chez General Biosystems. L’expression et la solubilité de ces fragments seront testées comme

précédemment. Finalement, 5 séquences seront retenues pour les études ultérieurs. Ces séquences

seront nommées DTEN X (X étant égal à 1, 2, 3, 4 ou 5). DTEN sera le nom de la séquence finale choisie.

Ces étapes de criblage sont particulièrement fastidieuses et seront potentiellement sous-

traitées à une entreprise ou une plateforme telle que la plateforme d’expression de protéines de EMBL

ou bien encore la plateforme automatisée de Marseille (30) (AFMB, Université d’Aix-Marseille).

Cependant, nous n’avons que peu d’informations concernant les coûts que pourrait représenter cette

sous-traitance.

2) Caractérisation des polypeptides DTEN

Pour continuer, l’effet des 5 polypeptides DTEN doit être évalué. On souhaite vérifier la

capacité des DTEN à améliorer la solubilité d’une protéine d’intérêt. De ce fait, les premières

expériences viseront à tester l’effet des polypeptides sur la solubilité d’une protéine connue. Pour

cette partie, la protéine étudiée sera la GFP. La GFP couplée à nos polypeptides sera produite encore

une fois chez E. coli BL21(DE3). Les cultures seront ensuite lysées afin de récupérer les protéines

recombinantes. Les lysats seront centrifugés afin que toutes les protéines non solubles se retrouvent

dans le culot. Les fractions solubles et insolubles seront analysées par SDS-PAGE afin d’obtenir une

estimation de la solubilité des protéines recombinantes. La procédure est donc la même que

précédemment. Encore une fois, la solubilité pourra être estimée grâce à l’équation précédente. Une

fois cette première estimation réalisée, une quantification plus précise sera réalisée par ELISA

(anticorps couplé à la HRP et ciblant la GFP).

Après cette première série de tests, nos protéines recombinantes seront purifiées à l’aide

d’une chromatographie d’affinité. Les fractions récupérées seront ensuite digérées par la protéase

TEV. Une seconde chromatographie d’affinité sera ensuite réalisée afin d’éliminer l’étiquette de

purification retirée précédemment. Les échantillons de protéines purifiées seront ensuite analysés par

diffusion dynamique de lumière (DLS) pour évaluer les niveaux d’agrégation associés aux DTEN-GFP.


40


41

Cette expérience nous donnera également des informations sur le rayon hydrodynamique de nos

protéines de fusion.

Afin d’obtenir des informations sur la taille apparente de nos constructions mais aussi pour

avoir une idée sur les quantités d’agrégats, une chromatographie d’exclusion couplée à un détecteur

de diffusion de lumière multi-angle (SEC-MALS) sera également réalisée.

Etant donné que nos polypeptides DTEN sont possiblement non structurés, les techniques

conventionnelles telles que le SDS-PAGE, la DLS et le SEC-MALS ne permettent pas d’obtenir des

informations tangibles sur la taille de nos protéines. En effet la nature non structurée des polypeptides

peut modifier le « comportement » de nos protéines dans un gel SDS-PAGE ou encore en SEC-MALS.

Ces modifications sont dues à l’augmentation significative des rayons hydrodynamiques de nos

protéines de fusion. Par conséquent, le seul moyen pour obtenir la taille exacte de notre construction

est une analyse par spectrométrie de masse (MS). Grâce à cette méthode, nous pourrons alors avoir

des informations très précises sur la taille des DTEN. Les agrégats pourront également être quantifiés.

Enfin, pour vérifier la monodispersité des polypeptides, et pour obtenir des informations

structurales sur nos échantillons, une analyse de diffusion des rayons X aux petits angles (SAXS) sera

réalisée. Cette expérience permettra d’obtenir des informations sur la conformation du polypeptide

non structuré. Il sera aussi possible d’avoir une idée plus précise du « bulking effect ».

Afin de mesurer l’efficacité de nos constructions, l’ensemble des tests réalisés précédemment

seront également réalisés avec la GFP seul.

DTEN vs étiquettes d’expression actuelles

1) Etude de l’efficacité de DTEN sur plusieurs protéines peu solubles

Dans un second temps, l’efficacité de nos constructions sera testée sur une protéine connue

pour être soluble lorsque celle-ci est produite à faible température, mais insoluble lorsque celle-ci est

produite à 37°C. La protéine à tester ici sera la CAPN2 (Calpain-2 catalytic subunit) (31). CAPN2 sera

donc produite chez E. coli BL21(DE3), avec ou sans nos polypeptides DTEN, à 22°C et 37°C. Une fois les

cultures lysées et les lysats centrifugés, le surnageant sera récupéré et le culot resuspendu dans de

l’urée. Un ELISA sera alors réalisé sur les différents échantillons afin de quantifier la quantité de

protéines contenue dans chaque fraction. Grâce à l’équation précédemment citée, nous aurons alors

un pourcentage de solubilité pour nos constructions. Ce pourcentage nous permettra d’estimer

l’efficacité des DTEN dans cette situation. Après cette première expérience, les fractions solubles de

nos protéines seront analysées par SDS-PAGE pour observer la présence ou non d’agrégats. Les

protéines seront ensuite purifiées de la même manière que précédemment. Les échantillons purifiés


42


43

seront alors analysés par DLS pour vérifier la monodispersité des solutions protéiques. Pour évaluer

le niveau d’agrégation des échantillons, une analyse SEC-MALS sera également réalisée. Une MS sera

ensuite effectuée afin de vérifier l’intégrité de nos échantillons. Cette MS permettra de quantifier nos

protéines et déterminera quelle est la condition la plus efficace pour produire la protéine CAPN2.

L’ensemble de ces tests seront réalisés avec des longueurs différentes pour chacun des polypeptides

testés. Cela nous permettra de trouver s’il y a une corrélation entre la taille des polypeptides et la

solubilité de CAPN2.

Nos constructions seront ensuite testées sur un ensemble de 14 protéines connues pour être

non solubles et n’ayant pas de domaines transmembranaires (32). Les protéines testées seront MAR

1 (NAD-dependent histone deacetylase SIR2), Q9UH52 (Mitochondrial import receptor subunit TOM6

homolog), SMPX (Small muscular protein), Q9UMT3 (YRO protein tyrosine kinase-binding protein),

Q9Y260 (ABP/ZF), SAA (Serum amyloid A-1 protein), BC10 (Bladder cancer-associated protein ), NCYM

(N-cym protein), Q9UMZ1 (Prothymosin a14), MCS (la Cyclin mcs2), DAP1 (la Cytochrome P450

regulator), RPP14 (Ribonuclease P protein subunit p14), BTG1 (la Protein BTG1) et PPR8 (

Pentatricopeptide repeat-containing protein 8). L’ensemble de ces protéines est connu pour avoir des

taux de solubilité inférieurs à 33% (32). La HSP1 (Heat shock protein 90) sera quant à elle utilisée

comme contrôle car son taux de solubilité est proche de 100%. L’ensemble de ces protéines seront

produites chez E.coli BL21(DE3). Comme pour les expériences précédentes, un test de solubilité sera

réalisé par ELISA sur les fractions solubles et insolubles, puis des expériences de DLS et SEC-MALS

quantifieront le degré d’agrégation dans les solutions protéiques. Les produits obtenus en fin de

purification seront analysés par MS pour déterminer précisément la nature des échantillons et

quantifier les protéines obtenues. L’ensemble de ces tests sera réalisé avec des longueurs différentes

pour chacun des DTEN testés. Cela nous permettra de trouver s’il y a une corrélation entre la taille des

polypeptides et la solubilité de ces protéines.

2) DTEN vs étiquettes d’expression conventionnelles

Pour comparer l’efficacité de nos constructions à celles des étiquettes de solubilités utilisées

fréquemment, les mêmes expériences seront réalisées en remplaçant nos constructions par des

étiquettes de solubilité déjà testées sur ces protéines. Les étiquettes testées seront le tag 6xHis (6

histidines, His-tag), la GST, NusA, l’étiquette synthétique de la région liant les chaines lourdes au

domaine B de la protéine A (ZZ) / le fragment Gb1 de la protéine G (Gb1) / la MBP et la Thioredoxine

(Trx). La comparaison de la capacité de solubilisation de ces différentes étiquettes nous permettra de

juger de l’efficacité de nos polypeptides DTEN.


44


45

3) Etude de l’impact de DTEN sur l’activité de la luciférase rénilla

Une fois l’efficacité des DTEN démontrée, nous devrons montrer que nos polypeptides

n’entraveront pas l’activité les protéines auxquelles ils seront liés. Pour cela, des tests d’activité sur

différentes protéines seront réalisés. Le premier test consistera à coupler une enzyme, la luciférase

rénilla, à nos constructions afin de tester son activité en présence de DTEN. La protéine sera produite

chez E.coli BL21(DE3), à 37°C. La luciférase rénilla couplée aux différents DTEN sera ensuite purifiée

par chromatographie d’affinité et quantifier par ELISA. L’activité de notre enzyme sera obtenue en

quantifiant la fluorescence d’une concentration définie de luciférase après ajout de la coelenterazine.

Le résultat obtenu sera comparé à l’activité de la même concentration de luciférase rénilla non

couplée aux polypeptides DTEN. Si une différence significative est trouvée, le même test sera réalisé,

avec cette fois-ci des polypeptides DTEN de tailles plus petites. Nous observerons ainsi s’il y a une

corrélation entre la taille du polypeptide et l’activité de la luciférase rénilla.

4) Impact de DTEN sur les interactions protéines-protéines et protéines-acides

nucléiques

Pour continuer, nous testerons les interactions protéine-protéine en présence de DTEN. Pour

cela, nous exprimerons la protéine NleH1 couplée à nos polypeptides et la protéine RPS3 (sans DTEN)

chez E. coli. Ces deux protéines sont connues pour interagir et être produites facilement chez E. coli

(33). Une fois les protéines purifiées, l’interaction sera vérifiée une première fois par co-

imunoprécipitation (Co-IP). Ensuite, l’interaction sera quantifiée par analyse de résonances de surface

plasmonique (SPR). Dans cette expérience, RPS3 sera fixé sur le support, et des concentrations de plus

en plus importantes de NleH1 couplé aux DTEN seront ajoutées. La quantification de cette interaction

nous indiquera de manière très précise si nos polypeptides DTEN inhibent les interactions protéine-

protéine. L’ensemble de ces tests seront réalisés avec des longueurs différentes pour chacun des

polypeptides testés. Cela nous permettra de trouver s’il y a une corrélation entre la taille des

polypeptides et l’efficacité d’interaction entre nos protéines d’intérêt.

De la même manière, Il est possible que l’activité d’une protéine dépende de son affinité à

l’ADN ou ARN. Pour tester cette interaction nous produirons la Taq DNA Polymérase fusionnée aux

DTEN. Une fois la protéine obtenue, nous réaliserons une quantitative Polymérase Chain Reaction

(qPCR) sur une séquence d’ADN modèle, comme la séquence d’ADN qui code pour la GFP. La même

qPCR sera réalisée avec une Taq DNA Polymérase produite sans DTEN. La différence de produit PCR

obtenue nous permettra d’observer l’effet des polypeptides sur les interactions ADN-protéines.


46


47

Comme précédemment, différentes tailles de polypeptides pourront être utilisées pour voir si la taille

du polypeptide joue sur l’activité de la Taq Polymérase.

5) Détermination des meilleurs ratio activité / solubilité

On peut éventuellement se trouver dans le cas où on trouve une corrélation positive entre la

taille de DTEN et la solubilité des protéines auxquelles ils sont fusionnés. Par contre, une corrélation

négative avec l’activité de ces mêmes protéines peut également être constatée. Cela pourrait être dû

à un encombrement stérique dû à la taille de DTEN. Celui-ci empêcherait alors la protéine fusionnée

de reconnaitre son ligand. Dans ce cas, Il faudra trouver un équilibre entre activité et solubilité de la

protéine conjuguée. Cet équilibre dépendra principalement de la taille de notre polypeptide. Pour

tester cet équilibre nous fusionneront des polypeptides de longueurs différentes à des protéines

d’intérêt et nous testerons leurs activités ainsi que leur solubilité.

La S-peroxidase (CWPO_C de Populus alba) produite chez E. coli n’est pas soluble mais peut être

purifiée lorsque produite en corps d’inclusion (34). Nous allons donc essayer de la produire

directement soluble grâce à nos constructions. Nous produirons chez E. coli BL21 différentes protéines

de fusions avec différentes tailles de polypeptides DTEN. Après avoir lysé les cultures, nous testerons,

dans un premier temps, la solubilité de nos protéines en réalisant un ELISA sur les fractions solubles

et insolubles de nos lysats. Cet ELISA sera réalisé avec des anticorps secondaires couplés à la GFP (au

lieu de la HRP) afin d’éviter que le résultat soit faussé par l’activité de notre échantillon (S-peroxidase).

Une fois les protéines purifiées, nous réaliserons un test d’activité enzymatique sur la peroxydase en

quantifiant la colorimétrie à 492 nm après ajout de 3,3′,5,5′-Tetramethylbenzidine (TMB). L’état

d’agrégation sera quantifié comme précédemment par DLS, SDS-PAGE et SEC-MALS. Une dernière

étape de MS sera réalisée pour vérifier la taille de nos protéines. Nous pourrons alors déterminer la

taille de nos polypeptides optimale pour avoir le meilleur rapport activité enzymatique / solubilité.

Sur le même principe nous allons chercher la taille optimale de nos polypeptides DTEN pour

avoir une protéine soluble qui conserve son interaction protéine / protéine. La protéine SAA est

connue pour interagir avec la Cystatine C (35). Toujours en testant différentes tailles de polypeptides

DTEN, la SAA sera produite en utilisant E. coli BL21 cultivée à 37°C. Les lysats seront séparés en

fractions solubles et insolubles comme vu précédemment. Les quantités de nos protéines d’intérêt

dans chaque fraction seront estimées par ELISA. Les protéines seront purifiées par chromatographie

d’affinité. L’interaction entre SAA et la Cystatine sera testée par Co-IP et SPR. Nous réaliserons

également des analyses par DLS, SDS-PAGE, SEC-MALS et MS pour obtenir des informations sur l’état

d’agrégation des protéines et pour vérifier que les constructions que nous étudions soient bien celles


48


49

que nous attendions. Après analyse des données obtenues, nous pourrons alors trouver la taille

optimale de notre polypeptide pour conserver à la fois le maximum de solubilité et l’activité de notre

protéine d’intérêt.

Nous étudierons ensuite la taille optimale de nos polypeptides DTEN pour conserver

l’interaction ADN / ARN-protéine et une bonne solubilité de ces protéines. RPP14 est une Ribonucléase

qui dégrade l’ARN (36). En testant différentes tailles de polypeptide, nous produirons RPP14 à partir

d’E. coli BL21 cultivée à 37°C. Les fractions solubles et insolubles seront séparées, et une quantification

de RPP14 par ELISA sera réalisée sur chaque fraction. Une fois la protéine purifiée, nous réaliserons

un gel retard pour déterminer la conservation de l’interaction entre L’ARN et RPP14. Des séquences

d’ARN marquées au phosphate 32 seront ajoutées à RPP14. Le mélange sera ensuite analysé par gel

retard. Les résultats obtenus sur le gel nous permettrons ainsi de vérifier que RPP14 interagit toujours

avec l’ARN. L’interaction ARN-RRP14 sera quantifiée par SPR. L’ARN sera fixé à un support métallique

et des concentrations croissantes de RRP14 seront ensuite ajoutées à des intervalles réguliers. Cette

quantification nous donnera la taille optimale du polypeptide DTEN pour avoir le meilleur ratio activité

/ solubilité.


50


51

Conclusion & Perspectives

L’objectif de notre projet est de concevoir une étiquette de solubilité qui aurait une efficacité

supérieure par rapport aux étiquettes déjà disponibles. DTEN, grâce à sa longue chaine

polypeptidique, devrait permettre d’isoler les protéines recombinantes du reste du cytoplasme et

donc de faciliter le repliement des protéines. Sa composition en acides aminés solubles permettra

d’assurer une importante solubilité. La présence d’une séquence de reconnaissance de la chaperonne

DnaK favorisera le repliement des protéines grâce à son effet de recouvrement et sa capacité à

recruter d’autres chaperones qui auront des effets positifs sur le repliement des protéines.

Une telle étiquette de solubilisation présenterait de nombreuses applications possibles. Par

exemple, elle pourrait être utilisée dans un contexte purement scientifique pour faciliter la production

de protéines insolubles, comme les facteurs de transcription par exemple. Il pourrait aussi être couplé

à des protéines utilisées dans le milieu industriel pour éviter les phénomènes d’agrégation et ainsi

augmenter le rendement de production. DTEN devrait alors rester fusionné à la protéine d’intérêt.

Dans ce cas, il sera important de conserver l’activité de la protéine d’intérêt. Dans le cas DTEN aurait

un effet négatif sur l’activité de la protéine fusionnée, il sera important de trouver un compromis entre

solubilité, agrégation et activité protéique. La longueur du polypeptide devra alors être modulée.

Cette modulation sera grandement simplifiée par la présence de nombreux sites de restriction

présents dans la séquence de nos polypeptides DTEN potentiellement non structurés.

Il est fort probable que dans le futur, DTEN soit couplé à des protéines thérapeutiques peu

solubles. La protéine de fusion complète devra alors être administré au patient. Des études

d’immunogénicité devront être réalisées chez l’animal puis sur l’Homme. Ces études cliniques

influenceront grandement sur le devenir de DTEN, qui pourra soit devenir un produit pouvant être

utilisé au sein de l’industrie pharmaceutique, ou soit devenir un outil de biotechnologies spécialisé

pour la production de protéines insolubles.

De nombreux marchés sont donc exploitables, et nous pourrons donc adapter notre produit

en fonction des caractéristiques finales de DTEN. Si DTEN obtient des résultats concluants par rapport

à la solubilité et l’agrégation, nous pourrons breveter la technologie.


52

Bibliographie

1. A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner.

Schellenberger, V. Nature Biotechnology, Vol. 27(12), pp. 1886-1190.

2. Motifs and supermotifs for MHC class II binding peptides. Sinigaglia, F. 1995, The Journal of

Experimental Medicine, Vol. 1181, pp. 449-451.

3. Efficient expression of full-length antibodies in the cytoplasm of engineered bacteria. Robinson, M.P.

2015, Nature Communications, Vol. 6, pp. 72-80.

4. Structural genomics of human proteins: target selection and generation of a public catalogue of

expression clones. Bussow, K. 2005, Microbial Cell Factories, Vol. 4, p. 21.

5. A screening strategy for heterologous protein expression in Escherichia coli with the highest return

of investment. Pacheco, B. 2012, Protein Expression and Purification, Vol. 81, pp. 33 - 41.

6. Solubilization and refolding of bacterial inclusion body proteins. Singh, S. 2005, Journal of Bioscience

and Bioengineering, Vol. 994, pp. 303 - 310.

7. Protein aggregation and its inhibition in biopharmaceutics. Wang, W. 2004, International Journal of

Pharmaceutics, Vol. 289, pp. 1 - 30.

8. Refolding techniques for recovering biologically active recombinant proteins from inclusion bodies.

Yamagushi, H. 2014, Biomolecules, Vol. 41, pp. 235-251.

9. Fusion tags for protein solubility, purification and immunogenicity in Escherichia coli: the novel Fh8

system. Costa, S. 2014, Frontiers in Microbiology, Vol. 5, p. 63.

10. Mechanisms for GroEL/GroES-mediated folding of a large 86-kDa fusion polypeptide in vitro.

Huang, Y.S. 1999, The Journal of Biological Chemistry, Vol. 27415, pp. 10405-10412.

11. Escherichia coli fusion carrier proteins act as solubilizing agents for recombinant uncoupling protein

1 through interactions with GroEL. Douette, P. 2005, Biochemical and Biophysical Research

Communications, Vol. 333 (3), pp. 686-693.

12. Mutations that alter the equilibrium between open and closed conformations of Escherichia coli

maltose-binding protein impede its ability to enhance the solubility of passenger proteins.

Nallamesetty, S. 2007, Biochemical and Biophysical Research Communications, Vol. 364 (3), pp. 639 -

644.

13. The acidity of protein fusion partners predominantly determines the efficacy to improve the

solubility of the target proteins expressed in Escherichia coli. Su, Y. 2007, Journal of Biotechnology,

Vol. 129 (3), pp. 373 - 382.

14. Tagging for protein expression. Malhotra, A. 2009, Methods in Enzymology, Vol. 129 (3), pp. 373-

382.


53

15. Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of

polypeptides to which it is fused. Kapust, R.B. 1999, Protein Science, Vol. 8 (8), pp. 1668 - 1674.

16. Chaperone machines for protein folding, unfolding and disaggregation. Saibil, H. 2015, Nature

Reviews Molecular Cell Biology, Vol. 14 (10), pp. 630 - 642.

17. Alternative modes of client binding enable functional plasticity of Hsp70. Mashaghi, A. 2016,

Nature, Vol. 539 (7629), pp. 448 - 451.

18. Heterogeneous binding of the SH3 client protein to the DnaK molecular chaperone. Lee, J.H. 2015,

PNAS, Vol. 112 (31), pp. 4206 - 4215.

19. DnaK functions as a central hub in the E. coli chaperone network. Calloni, G. 2012, Cell Reports,

Vol. 1 (3), pp. 251-264.

20. Interaction of Hsp70 chaperones with substrates. Rüdiger, S. 1997, Nature Structural & Molecular

Biology, Vol. 4 (5), pp. 342 - 349.

21. The solubility of the amino acids in water. Max, S. 1933, Journal of Biological Chemistry, Vol. 103 ,

pp. 579 - 595.

22. The solubilty of Amino Acids and related compounds in aqueous urea solutions. Nozaki, Y. 1963,

Journal of Biocehmistry, Vol. 103, pp. 579 - 595.

23. The solubility of amino acids and two glycine peptides in aqueous ethanol and diaxone solutions.

Nozaki, Y. 1971, Journal of biological chesmistry, Vol. 246 (7), pp. 2211-2217.

24. Solubility of amino acids in water and aqueous solutions by the statistical assocoating fluid theory.

Ji, P. 2008, Industrial and Engineering Chemistry Research, Vols. 103-1933, pp. 579-595.

25. A solubility enhancing tag (SET) for NMR studies of poorly behaving proteins. Zhoua, P. 2001,

Journal of biomolecular NMR, Vol. 20, pp. 11 - 14.

26. Mutational analysis of protein solubility enhancement using short peptide tags. Kato, A. 2007,

Bioploymers, Vol. 85 (1), pp. 12 - 18.

27. Fusion of a recombinant antibody fragment with a homo-amino-acid polymer: effects on

biophysical properties and prolonged plasma half-life. Schlapschy, M. 2007, Prtoein Engineereing,

Design and Selection, Vol. 20 (6), pp. 273 - 284.

28. Protein aggregation during overexpression limited by peptide extensions with large net negative

charge. Zhang, YB. 2004, Protein Expression and Purification, Vol. 36 (2), pp. 207 - 216.

29. High-throughput screening of soluble recombinant proteins. Shih, Y.S. 2002, Protein Sciences, Vol.

11 (7), pp. 1714 - 1719.

30. High Throughput Quantitative Expression Screening and Purification Applied to Recombinant

Disulfide-rich Venom Proteins Produced in E. coli. Saez, N.J. 2014, The Journal of Visualized

Experiments, Vol. exp(89), p. e:51464.


54

31. Efficient expression and purification of recombinant human m-calpain using an Escherichia coli

expression system at low temperature. Hata, S. 2012, The Journal of Biochemistry, Vol. 18 (9), pp. 753-

763.

32. Rapid screening for improved solubility of small human proteins produced as fusion proteins in

Escherichia coli. Hammarström, M. 2002, Protein Sciences, Vol. 11 (2), pp. 313-321.

33. Escherichia coli virulence protein NleH1 interaction with the v-Crk sarcoma virus CT10 oncogene-

like protein (CRKL) governs NleH1 inhibition of the ribosomal protein S3 (RPS3)/nuclear factor κB (NF-

κB) pathway. Pham, T.H. 2013, The Journal of Biological Chemistry, Vol. 288 (48), pp. 34567 - 34574.

34. Optimized refolding and characterization of S-peroxidase (CWPO_C of Populus alba) expressed in

E. coli. Pham, T.M. 2011, Protein Expression and Purification, Vol. 80 (2), pp. 268 - 273.

35. Interaction of serum amyloid A with human cystatin C--assessment of amino acid residues crucial

for hCC-SAA formation (part II). Spodzieja, M. 2013, Journal of Molecular Recognition, Vol. 26 (9), pp.

415 - 425.

36. A protein subunit of human RNase P, Rpp14, and its interacting partner, OIP2, have 3′→5′

exoribonuclease activity. Jiang, T. 2002, PNAS, Vol. 99 (8), pp. 5295 - 5300.

PROJET DE RECHERCHE - m2p-egpr.ups-tlse.fr archives/55 - Conception d'un... · améliorant la...

Documents

Transcript of PROJET DE RECHERCHE - m2p-egpr.ups-tlse.fr archives/55 - Conception d'un... · améliorant la...