PROJET DE RECHERCHE - m2p-egpr.ups-tlse.fr archives/55 - Conception d'un... · améliorant la...
Transcript of PROJET DE RECHERCHE - m2p-egpr.ups-tlse.fr archives/55 - Conception d'un... · améliorant la...
Master 2 EGPR 2016-2017
Conception d’un polypeptide de fusion personnalisable
améliorant la solubilité et le repliement des protéines recombinantes
PROJET DE RECHERCHE
AUTEURS :
Loïc Grandvuillemin
Noureldin Youssef
Amine Belaouad
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
2
Remerciements
Dans un premier temps, nous souhaitons remercier Rémy Poupot pour ses judicieux conseils
ainsi que pour le temps précieux qu’il nous a accordé.
Nous remercions également Laurence Nieto pour ses questions et remarques qui nous auront
poussés à développer davantage notre esprit scientifique.
Un grand merci aussi à Laurent Paquereau pour le temps qu’il nous a consacré, bien qu’il ne
soit initialement pas impliqué dans l’encadrement. Son expertise nous aura en effet été d’un grand
secours.
Nous remercions aussi Samuel Tranier pour ses enseignements. Ces derniers nous ont permis
d’avancer énormément au niveau de notre projet.
Enfin, nous remercions l’ensemble de la promotion du M2 EGPR 2016-2017 pour la super
ambiance, mais aussi et surtout pour les fous rires (!).
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
3
ABBREVIATIONS
F : Phenylalanine
I : Isoleucine
M : Methionine
V: Valine
W: Tryptophane
Y: Tyrosine
N : Asparagine
Q : Glutamine
H : Histidine
K : Lysine
R : Arginine
A : Alanine
E : Glutamine
G : Proline
S : Sérine
T : Thréonine
E-XTEN : Exénatide – XTEN
E. coli : Escherichia coli
SDS-PAGE : Dodécylsulfate de sodium – Electrophorèse sur gel de polyacrylamide
GLP-1 : Glucagon-like peptide 1
kDa : Kilo Dalton
SEC-MALLS : Chromatographie d’exclusion- Diffusion multi-angles de lumière de laser
BSA : Albumine de sérum bovin
PEG : Polyéthylène glycol
ELSPAR : Asparaginase
ELISA : Enzyme-linked immunosorbent assay
IgG : Immunoglobuline G
HRP : Peroxydase de raifort
ABTS : Acide 2,2'-azino-bis(3-éthylbenzothiazoline-6-sulphonique
mg : Milligramme
kg : Kilogramme
h : Heure
ml : Millilitre
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
4
Hpred : Valeur prédite chez l’homme pour le paramètre correspondant
R2 : Coefficient de détermination
Cl : Clairance
Vd : Volume de distribution
MBP : Maltose Binding Protein
NusA : Substance de N-utilization
SET : Etiquette d’amélioration de solubilité
SEP : Peptide d’amélioration de solubilité
Trx : Thioredoxine
GST : Glutathion S-Transférase
TIMP1 : Inhibiteur des metalloprotéases des tissus de classe 1
CAT : Chloramphenicol acétyl transférase
GFP : Green fluorescent protein
TEV : Tobacco etch virus
HPV : Papillomavirus humain
SAFT : Théorie statistique associée aux fluides
pH : Pouvoir Hydrodynamique
EMBL : Laboratoire européen de biologie moléculaire
DTEN : DnaK-TEN
DLS : Diffusion dynamique de la lumière
MS : Spectrométrie de masse
SAXS : Diffusion des rayons X aux petits angles
CAPN2 : Sous-unité catalytique de Calpain-2
MAR1 : déacetylase d’histones SIR2 NAD-dépendente
Q9UH52 : Récepteur d’importation mitochondriale homologue deTOM6
SMPX : Petite protéine musculaire
Q9UMT3/ YRO : Protéine liant la tyrosine kinase
Q9Y260 : ABP/ZF
SAA : Protéine A-1 du sérum amyloide
BC10 : Protéine associée au cancer de la vessie
NCYM : Protéine N-cym
Q9UM71 : Prothymosine a14
MCS : Cycline mcs2
DAP1 : Régulateur du cytochrome P450
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
5
RPP14 : Sous-unité p14 de la ribonucléase P
PPR8 : Pentatricopeptide repeat-containing protein 8, mitochondrial
HSP1 : Heat shock protein 90
His-tag: étiquette histidine
ZZ : l’étiquette synthétique de la région liant les chaînes lourdes au domaine B de la protéine A
Gb1 : fragment de la protéine G
RPS3 : Protéine ribosomale S3
TMB : 3,3′,5,5′-Tetraméthylbenzidine
SAA : Sérum Amyloide
ADN : Acide désoxyribonucléique
ARN : Acide ribonucléique
LB : Milieu Luria-Bertani
Co-IP : Co-Immunoprécipitation
SPR : Résonance de surface plasmonique
qPCR : Réaction quantitative en chaîne par polymérase
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
6
TABLE DES MATIÈRES
REMERCIEMENTS ............................................................................................................................................. 2
ABBREVIATIONS .............................................................................................................................................. 3
ANALYSE D’UNE PUBLICATION : XTEN.............................................................................................................. 7
1) XTEN : CONCEPTION ET CARACTERISATION ......................................................................................................... 7
2) XTEN : IMMUNOGENICITE ............................................................................................................................. 11
3) XTEN & DUREE DE DEMI-VIE DES PROTEINES RECOMBINANTES .............................................................................. 13
INTRODUCTION : VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE ............................................................. 17
1) PRODUCTION DE PROTEINES RECOMBINANTES CHEZ E. COLI : LES LIMITES ................................................................ 17
2) LES ETIQUETTES D’EXPRESSION ACTUELLES ET LEUR(S) MECANISME(S) ..................................................................... 21
3) DNAK : UNE CHAPERONE D’IMPORTANCE MAJEURE CHEZ E. COLI ........................................................................... 23
4) NOTRE PROJET ............................................................................................................................................. 25
CONCEPTION DE L’ETIQUETTE D’EXPRESSION : DTEN .................................................................................... 29
1) STRUCTURE PRIMAIRE ET TAILLE DE DTEN ......................................................................................................... 29
2) DTEN ET IMMUNOGENICITE ........................................................................................................................... 31
4) CONSTRUCTION PLASMIDIQUE ......................................................................................................................... 33
DTEN ET DNAK : SOLUBILITE & REPLIEMENT .................................................................................................. 35
1) CRIBLAGE D’UNE BANQUE DE PEPTIDES INTERAGISSANT POTENTIELLEMENT AVEC DNAK .............................................. 35
2) ETUDE DE L’INTERACTION ENTRE DTEN ET DNAK ............................................................................................... 35
CRIBLAGE & CARACTERISATION DE DTEN ...................................................................................................... 37
1) METHODE DE CRIBLAGE ................................................................................................................................. 37
2) CARACTERISATION DES POLYPEPTIDES DTEN ..................................................................................................... 39
DTEN VS ETIQUETTES D’EXPRESSION ACTUELLES ........................................................................................... 41
1) ETUDE DE L’EFFICACITE DE DTEN SUR PLUSIEURS PROTEINES PEU SOLUBLES ............................................................. 41
2) DTEN VS ETIQUETTES D’EXPRESSION CONVENTIONNELLES .................................................................................... 43
3) ETUDE DE L’IMPACT DE DTEN SUR L’ACTIVITE DE LA LUCIFERASE RENILLA ................................................................ 45
4) IMPACT DE DTEN SUR LES INTERACTIONS PROTEINES-PROTEINES ET PROTEINES-ACIDES NUCLEIQUES ............................ 45
5) DETERMINATION DES MEILLEURS RATIO ACTIVITE / SOLUBILITE ............................................................................... 47
CONCLUSION & PERSPECTIVES ...................................................................................................................... 51
BIBLIOGRAPHIE .............................................................................................................................................. 52
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
7
Analyse d’une publication : XTEN
Parmi les défis actuels que confronte l’industrie pharmaceutique, le temps de demi-vie des
médicaments biologiques représente un enjeu majeur. En effet, celui-ci est très discuté au sein de la
communauté scientifique et les entreprises pharmaceutiques sont encore et toujours à la recherche
de technologies innovantes permettant d’améliorer cette durée de demi-vie. Le but est d’espacer les
prises de médicaments et donc de diminuer les coûts extrêmement important liés aux traitements.
Pour résoudre ce problème, Dr. Schellenberger et ses collaborateurs se sont lancés dans le
développement d’un long polypeptide non structuré permettant d’augmenter la durée de demi-vie
des protéines auxquelles il est fusionné. La technologie a été reportée dans un article s’intitulant « A
recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner »
(1). La publication est parue dans le journal Nature Biotechnology. Cette technologie a mené à la
création d’Amunix, Californie, USA, dont Dr. Schellenberger est le CEO.
1) XTEN : Conception et caractérisation
Ce polypeptide non structuré que cette équipe a développé a été nommé XTEN. Pour aboutir
à XTEN, Dr. Schellenberger et ses collaborateurs ont d’abord sélectionné les acides aminés qui
composeraient un tel polypeptide. Tout d’abord, les acides aminés hydrophobes (F, I, L, M, V, W et Y)
ont été exclus pour deux raisons. La première est que ceux-ci contribuent à des structures compactes
et/ou l’agrégation. La seconde raison est que ces acides aminés sont réputés pour être reconnus par
le complexe majeur d’histocompatibilité (2) et donc peuvent impliquer une certaine immunogénicité,
néfaste dans le cas des protéines médicaments. D’autres acides aminés ont des propriétés indésirables
pour une molécule destinée à un usage clinique. Ainsi, les auteurs ont aussi exclu les acides aminés
qui comportent des fonctions amides (N, Q). En effet, ils participent à l’instabilité à long terme des
biomédicaments car ils sont instables chimiquement. Pour continuer, les acides aminés chargés
positivement (H, K, R) ont aussi été écartés car ils participent aux liaisons avec la membrane cellulaire.
Enfin, les cystéines ont aussi été bannies car elles sont connues pour contribuer fortement à
l’agrégation via les ponts disulfures.
De cette manière, les auteurs ont choisi les 6 aminés qui composeront leur polypeptide :
Alanine (A), glutamine (E), glycine (G), proline (P), sérine (S) et thréonine (T). Ils ont ensuite généré
une librairie de séquences à partir de ces 6 acides aminés. Cette librairie inclus uniquement des
segments de 36 acides aminés, ces derniers étant placés aléatoirement. Chaque segment comporte
un pourcentage précis des acides aminés sélectionnés précédemment (8% A, 12% E, 18% G, 17% P,
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
8
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
9
28% S et 17% T). Il n’y a pas plus de précisions concernant la méthode choisie pour déterminer ces
pourcentages. Pour poursuivre, un criblage a été réalisé sur ~1500 fragments afin de choisir les
fragments les mieux exprimés, pour arriver au final à 5 fragments. Ces 5 fragments ont ensuite été
discriminés en fonction de plusieurs critères : stabilité génétique, solubilité, thermostabilité et
résistance à l’agrégation. En utilisant cette méthode, une seule séquence a été choisie pour les études
qui vont suivre, celle-ci a été nommée XTEN.
Afin de réunir les caractéristiques physico-chimiques de XTEN, celui-ci a été couplé à un anti-
diabétique (Figure 1a) : L’exénatide. L’exénatide est une protéine agoniste du récepteur GLP-1
(peptide-1 de type glucagon). Dans l’organisme, l’exénatide augmente la production d’insuline et
permet donc de diminuer le taux de glucose dans le sang.
Pour démarrer, un SDS-PAGE en condition non réductrice a été réalisé afin d’observer la
pureté de E-XTEN après l’avoir produit chez E. coli (Figure 1b). L’exénatide fusionné à XTEN (E-XTEN)
a un poids moléculaire théorique de 84 kDa mais a migré à un poids moléculaire apparent de 160 kDa.
D’après ces données, E-XTEN semble non structuré et son rayon hydrodynamique semble entrainer
un ralentissement pendant la migration dans le gel. Cependant, la taille obtenue correspond à la taille
d’un potentiel dimère donc d’autres analyses ont été effectuées pour confirmer l’hypothèse des
auteurs.
Tout d’abord, E-XTEN a été analysé par dichroïsme circulaire (Figure 1c). Le spectre obtenu
est caractéristique d’une protéine non repliée. Il en a été déduit que E-XTEN est non structuré et qu’il
ne présente pas de structure secondaire.
E-XTEN a ensuite été analysé par spectrométrie de masse pour voir si l’échantillon est pur mais
aussi pour vérifier le poids moléculaire de la protéine de fusion (Figure 1d). Le spectre obtenu montre
trois pics correspondant à une protéine de 83 kDa chargée entre une et trois fois. Ces résultats
confirment la pureté de l’échantillon. Ils confirment aussi que le poids moléculaire de E-XTEN est bien
de 83 kDa.
Enfin, une analyse SEC-MALS (Chromatographie d’exclusion couplée à un détecteur de
diffusion de lumière multi-angle) a été réalisée pour comparer le rayon hydrodynamique de E-XTEN à
d’autres protéines possédant des rayons hydrodynamiques plus ou moins importants (Figure 1e). E-
XTEN est élué au départ, avant l’apoferritine qui est une protéine de 475 kDa. Le polypeptide XTEN a
donc un rayon hydrodynamique très important.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
10
Figure 1 Production et caractérisation biophysique d’une protéine de fusion Exénatide-XTEN (E-XTEN). (a) Production d’une protéine médicament prototypique fusionnée à XTEN. Un gène codant pour une protéine médicament est fusionné à un gène codant pour XTEN et est placé sous la régulation d’un promoteur d’expression pour produire la construction complète chez E. coli. (b-e) Caractérisation biophysique de E-XTEN purifié et exprimé chez E.coli. La protéine purifiée a été analysée par SDS-PAGE (b), dichroïsme circulaire (c), spectrométrie de masse (d), et par chromatographie d’exclusion couplée à un détecteur de diffusion de lumière multi-angle (MALS, e). (b) SDS-PAGE non réducteur de E-XTEN purifié. Le premier puits contient un marqueur de taille. Le deuxième puits contient 2,5 µg de E-XTEN purifié. (c) Spectre de dichroïsme circulaire de E-XTEN obtenu à 25°C. (d) M+, M2+ et M3+ représentent les ions parents de E-XTEN chargé une fois, deux fois, et trois fois. (e)E-XTEN et des protéines standards sont toutes sujets indépendamment à des expériences successives de SEC-MALLS. Les résultats sont superposés pour faciliter la comparaison. Poids moléculaire attendu pour chaque protéine de référence : BSA, 66 kDa; aldolase, 155 kDa; apoferritin, 475 kDa.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
11
2) XTEN : Immunogénicité
Après avoir caractérisé E-XTEN, les auteurs se sont penchés sur l’immunogénicité que le
polypeptide était susceptible de déclencher. Pour ce faire, la première procédure a été de mettre en
place des groupes de 3 souris puis d’injecter un antigène par groupe parmi 3 antigènes, en présence
ou non d’adjuvant de Freund :
E-XTEN ;
E-PEG40 (Exénatide couplé à PEG40), PEG40 étant un polyéthylène glycol validé cliniquement
et utilisé pour augmenter la durée de demi-vie de l’exénatide ;
ELSPAR (L-asparaginase), il s’agit d’une molécule capable d’engendrer une réponse
immunaitaire importante, c’est donc un contrôle positif d’immunogénicité.
Après 11 injections à 2 jours d’intervalle, le sang des souris a été prélevé et centrifugé dans le
but de récupérer le plasma contenant les anticorps. Une fois le plasma récupéré, plusieurs ELISA
indirectes ont été effectués. En effet, les antigènes ont été d’abord immobilisés dans les puits avant
de faire passer le plasma contenant potentiellement des anticorps contre ces mêmes antigènes. Par
la suite, les expérimentateurs ont ajouté des anticorps secondaires anti-IgG de souris couplés à la
peroxydase de raifort (HRP) pour ensuite révéler en utilisant l’ABTS (acide 2,2'-azino-bis(3-
éthylbenzothiazoline-6-sulphonique), substrat de la HRP). Les résultats sont reportés dans la table 1.
Ainsi, E-XTEN présente une immunogénicité non détectable par rapport au blanc, aussi bien en
absence qu’en présence d’adjuvant. En revanche, E-PEG40 présente une souris sérum positive en
présence d’adjuvant indiquant ainsi que E-XTEN est, non seulement moins immunogène que E-PEG40,
mais aussi qu’il ne présente pas une immunogénicité détectable dans ce test.
Pour confirmer ces résultats, les auteurs ont décidé de réaliser une expérience similaire mais
cette fois sur 20 souris au total (Figure 2). Encore une fois, les échantillons de plasma ont été analysés
pour leur présence d’anticorps contre E-XTEN ou l’exénatide seul. Sur la figure 2A, 10 animaux sur 20
ont montré un titre détectable d’anticorps contre E-XTEN (défini comme un signal deux fois plus
important du dosage terminal en comparaison avec le pré-saigné, ce dernier correspondant à
l’échantillon de sérum récupéré avant injection de l’antigène) pour une dilution de 1 :100. Pour une
dilution de 1 :500 (Figure 2B), seulement 5 souris sont sérum positives en se basant sur ce critère de
détermination. Par la suite, pour déterminer le titre spécifique à l’exénatide, une dilution à 1 :500 a
été réalisée et 2 des 5 animaux ont été décrétés sérum positifs pour des anticorps contre l’exénatide.
L’ensemble de ces résultats indique que E-XTEN présente une immunogénicité faible,
notamment en comparaison avec PEG-40, qui est validée cliniquement.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
12
Table 1 Immunogénicité de E-XTEN en présence et en absence d’adjuvant. Trois antigènes ont été testés pour la présence d’anticorps les ciblant : E-XTEN, E-PPEG40 et ELSPAR. Une souris est dite sérum positive si les IgG contre l’antigène a donné un signal deux fois plus important que le signal du blanc (background). Le titre constitue la dilution du sérum maximale moyenne donnant une réponse positive en ELISA au moins deux fois plus importante que le background.
Figure 2 E-XTEN a une faible incidence sur l’immunogénicité chez les souris. En bleu : plasma avant injection de l’antigène,
jaune : plasma récupéré à la 5ème semaine de traitement, rouge : plasma récupéré après 7 semaines de traitement. En
ordonnée est présenté la densité optique mesurée après révélation de l’ELISA ; En abscisse est représenté chaque souris (20
au total). Les données sont présentées pour des dilutions à 1 :100ème (A) et 1 :500ème (B et C).
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
13
3) XTEN & durée de demi-vie des protéines recombinantes
Pour finir, les auteurs se sont intéressés aux paramètres pharmacologiques de E-XTEN : durée
de demi-vie, biodisponibilité, volume de distribution et clairance.
Tout d’abord, ils ont déterminé la durée de demi-vie de E-XTEN. Pour ce faire, des singes
cynomolgus ont été traités avec une dose de 1mg/kg de E-XTEN par administration en sous-cutanée
et intraveineux. Les expérimentateurs ont mesuré les concentrations plasmatiques de E-XTEN à
différents temps pendant 350 heures. La première observation qui découle des résultats est le fait
que la phase d’absorption de E-XTEN injecté en sous-cutanée est lente (entre 24 et 48h, figure 3a).
Par comparaison, l’exénatide seul et les principes actifs en général injectés en sous-cutanée
présentent des phases d’absorption plus rapides, par exemple plusieurs heures seulement pour
l’exénatide seul. De plus, après avoir atteint une concentration plasmatique maximale à 48h, celle-ci
reste à peu près stable jusqu’à 100h, en sous-cutanée. Ceci est une caractéristique intéressante de E-
XTEN puisqu’il réside longtemps dans l’organisme des singes traités dans cette étude. Après 100h, une
diminution graduelle de la concentration plasmatique de E-XTEN est observée, et ceci jusqu’à la fin
des mesures. Dans ces conditions, la durée de demi-vie de E-XTEN a été calculée comme étant de 60h.
Cette valeur est beaucoup plus importante que l’exénatide seul, qui lui n’est disponible que quelques
heures dans le sang. La biodisponibilité a été aussi déterminée. Elle s’avère être de 80%, E-XTEN
présente donc des caractéristiques pharmacologiques intéressantes.
Malgré tout, un élément important est à prendre en compte : l’activité de E-XTEN. En effet,
ces bonnes caractéristiques pharmacologiques ne suffisent pas à elles-mêmes à conclure de
l’efficacité de XTEN. Ce dernier ne doit pas entraver l’activité de l’exénatide auquel il est fusionné.
L’exénatide permet de diminuer le taux de glucagon. Le glucagon va à son tour augmenter le taux
d’insuline et par conséquent réduire la concentration en glucose dans le sang. Pour évaluer l’activité
de E-XTEN, des souris à jeun ont été traitées avec un placebo, l’exénatide seul ou bien encore E-XTEN.
Ces injections sont effectuées 48h avant une administration en glucose. Le but est de comparer
l’efficacité de l’exénatide seul et celle de E-XTEN. Après cette administration, les concentrations
plasmatiques en glucose seront mesurées toutes les deux heures. Les résultats de cette expérience
sont présentés sur la figure 3b. En traitant les souris avec le placebo ou l’exénatide seul, on observe
une concentration en glucose qui augmente rapidement après l’administration en glucose. Celle-ci
reste assez constante, avec toutefois une diminution à partir de 60 minutes. Ces observations sont
dues au fait que le placebo et l’exénatide (t1/2 = 0.17h chez les souris) sont rapidement éliminés. En
revanche, dans le cas de E-XTEN, celui-ci ne semble pas être éliminé par les souris. En effet, la
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
14
Figure 3 Caractérisation in vivo de E-XTEN. (a) Profil pharmacocinétique de 1mg/kg de E-XTEN injecté par voie intraveineuse ou sous-cutanée chez des singes Cynomolgus. Les points représentent la moyenne (± déviation standard) de chaque groupe composé de 3 singes. (b) Efficacité in vivo de E-XTEN chez des souris normales. Les points représentent la moyenne (± déviation standard) de chaque groupe composé de 6 souris. 48 heures avant le test de résistance au glucose, les animaux ont reçu une injection péritonéale de placebo, 10 µg exenatide ou 250 µg E-XTEN (équivalent molaire). Le moment où le glucose est injecté est marqué par une flèche. Le taux de sucre dans le sang a été testé avec un glucomètre pendant 2 heures. Les points marqués avec un astérisque correspondent à des taux de sucre dans le sang qui sont significativement différents par rapport au groupe placebo.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
15
concentration de E-XTEN dans le plasma n’augmente que très légèrement après administration du
glucose et reste plutôt stable par la suite.
Finalement, les auteurs ont utilisé les mesures pharmacologiques de E-XTEN tirées d’autres
modèles animaux pour établir des échelles allométriques en fonction du poids pour prédire les
paramètres pharmacologiques de E-XTEN chez l’homme. Ces résultats sont présentés sur la figure 4.
Il est ainsi possible de prédire que E-XTEN aura chez l’homme une durée de demi-vie de 139h, avec
une clairance de 30 mL/h et un volume de distribution de 5.970 mL.
Pour conclure sur cette publication, il a été montré que XTEN est une protéine de fusion
efficace pour améliorer la durée de demi-vie des protéines médicaments. De plus, ce polypeptide est
non immunogène, simple à produire, très soluble mais aussi biodégradable. Il serait cependant
nécessaire de réaliser d’autres études plus approfondies, notamment concernant la manière dont
XTEN arrive à « protéger » l’exénatide afin d’empêcher que ce dernier soit éliminé, tout en conservant
son activité. Dans l’article, ils présentent cela comme étant le « bulking effect », c’est-à-dire le fait que
XTEN aura tendance à entourer l’exénatide, grâce à sa grande taille, sa flexibilité et sa solubilité.
Néanmoins, cette étude a été publiée en 2009 et entre temps, plusieurs articles impliquant XTEN ont
été publiés avec des données plus précises sur ce polypeptide, mais ne donnant pas plus
d’informations sur ce « bulking effect ». Aussi, plusieurs médicaments utilisant la technologie XTEN
sont en phases précliniques ou cliniques, le plus avancé étant en phase 3. Cette technologie semble
donc fonctionner. La méthode de conception de XTEN ainsi que ce « bulking effect » nous ont
notamment intéressés pour une tout autre application que nous allons vous présenter dans la suite
de ce rapport.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
16
Figure 4 Echelles allométriques des paramètres pharmacocinétiques de E-XTEN chez l’humain obtenus à partir de 4 espèces différentes. (a-c) Echelle allométrique du temps de demi-vie de E-XTEN (a), clairance (b) et volume de distribution (c). Les points pour chaque espèce (carrés pleins) sont marqués de façon que : M, souris (0.025 kg); R, rat (0.25 kg); C, singe cynomolgus (5 kg); D, chien (beagle; 12 kg). La prédiction a été réalisé à partir d’un ajustement linéaire des données (Hpred, carré claire). Les valeurs humaines prédites pour chaque paramètre sont affichées sur chaque point, le R² est affiché sur chaque ajustement linéaire. Le temps de demi-vie chez l’Homme peut également être estimé grâce à la valeur prédictive de la clairance(CI) et le volume de distribution (Vd) de façon à ce qu’elle soit égale à 0.693 × Vd/Cl. L'application de cette formule donne une demi-vie prédite de 139 h chez l'homme, ce qui concorde avec l'extrapolation linéaire.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
17
Introduction : Vers une étiquette d’expression innovante
Plusieurs caractéristiques de XTEN sont intéressantes. Ce dernier est d’abord de taille
importante par rapport à la taille de la protéine à laquelle il est fusionné. Il est aussi très facile à
produire chez E. coli mais aussi très soluble, ce qui conduit XTEN à une stabilité accrue. Cette solubilité
importante est due à sa structure primaire. XTEN est composé uniquement d’acides aminés qui
tendent à augmenter la solubilité des protéines. Enfin, il est non structuré, il ne possède pas de
structures secondaires et est donc très flexible, c’est ce qui permet ce fameux « bulking effect » et
donc la tendance que le polypeptide aura à entourer et « protéger » la protéine à laquelle celui-ci est
fusionné. L’ensemble de ces aspects nous ont tout de suite parus comme étant des caractéristiques
très pertinentes pour un tag d’expression. Cependant, malgré que l’idée soit très intéressante, de
nombreuses informations devaient être vérifiées. Ainsi, le but de cette introduction est de déterminer
si concevoir une étiquette d’expression similaire à XTEN est convaincant.
1) Production de protéines recombinantes chez E. coli : Les limites
Jusqu’à récemment, pour produire des protéines médicaments, la tendance s’orientait plutôt
vers les systèmes eucaryotes supérieurs. Avant cela, les systèmes bactériens et notamment E. coli
étaient les systèmes de choix. Ceci est notamment dû au fait que la biomasse obtenue en utilisant E.
coli est extrêmement importante. Malgré que les systèmes eucaryotes supérieurs soient privilégiés,
la tendance est en train de revenir vers E. coli car de nouvelles souches voient le jour. Par exemple, la
souche ClearColi BL21 (DE3) de Lucigen permet d’éliminer les endotoxines à la source. En effet,
l’absence d’endotoxines est critique pour les protéines médicaments. Certaines souches de E. coli ont
aussi été améliorées pour permettre de faire des modifications post-traductionnelles. À titre
d’exemple, les auteurs d’une publication parue en 2015 dans Nature Communications ont réussi à
produire des anticorps entiers dans le cytoplasme d’E. coli (3). Pour ce faire, une souche améliorée
d’E. coli appelée SHuffle a été utilisée. Cette souche permet notamment la formation correcte de
ponts disulfures dans le cytoplasme d’E. coli. L’ensemble de ces informations nous amènent plutôt à
nous intéresser au système E. coli plutôt que les autres systèmes. Plusieurs autres éléments nous ont
conduits à ce choix, nous les détaillerons au fur et à mesure dans cette introduction.
Tout d’abord, il est important de préciser que des études précédentes (4) (5) ont montré que
75% des protéines humaines ont pu être exprimées chez E. coli, avec toutefois seulement 25% de
protéines produites sous forme soluble et active. En effet, exprimer des protéines chez E. coli
représente un défi considérable. Le problème le plus souvent rencontré est l’agrégation. Le milieu peu
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
18
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
19
oxydant dans le cytoplasme de E. coli n’est pas favorable à la formation normale de ponts disulfures.
Ceci va souvent conduire à un mauvais repliement de la protéine recombinante. Le mauvais
repliement de la protéine recombinante va à son tour contribuer à l’agrégation. Ainsi, lorsque des
protéines recombinantes sont surexprimées dans le cytoplasme d’E. coli, des corps d’inclusion
peuvent se former (6). Il y a toujours un équilibre entre la forme native d’une protéine (correctement
repliée), la forme intermediaire (pas complètement repliée) et la forme non repliée. Il y a aussi un
équilibre entre la forme intermediaire et la forme agrégée, cet équilibre étant fortement dirigée vers
la formation d’agrégats (7) (figure 5).
Pour pallier au problème d’agrégation, plusieurs solutions sont à disposition. La solubilisation
des corps d’inclusion après production s’avère être une solution efficace pour les petites protéines et
les peptides. Il existe même des étiquettes qui permettent de faire produire les protéines d’intérêt
sous forme de corps d’inclusion. En effet, dans ce cas, la quantité de corps d’inclusion obtenue est
souvent très importante et il est possible de récupérer un certain pourcentage de protéines sous
forme soluble, ce pourcentage étant souvent variable selon les cas (8). Cependant, cette méthode a
tendance à être rentable uniquement pour les petites protéines. De plus, il est souvent difficile
d’obtenir un rendement correct en solubilisant les corps d’inclusion. Ainsi, pour éviter la formation
d’agrégats, il est possible de fusionner une étiquette dite d’expression (ou de solubilité) à la protéine
d’intérêt. Cette étiquette va notamment permettre d’éviter la formation d’agrégats par différents
mécanismes selon le type d’étiquette utilisé.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
20
Figure 5 Equilibre entre les formes natives, intermédiaires, non repliées et agrégées. N : forme native, I : forme intermédiaire, U : forme non repliée, A : forme agrégée (agrégats). L’équilibre entre I et A est fortement biaisé vers A, comme le montre la flèche I -> A de taille plus importante que A -> I.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
21
2) Les étiquettes d’expression actuelles et leur(s) mécanisme(s)
Pour surmonter l’agrégation des protéines recombinantes, les étiquettes d’expression sont
extrêmement utilisées de par leur efficacité et leur facilité d’utilisation. D’après (9), à l’heure
d’aujourd’hui, les mécanismes par lesquels les étiquettes de fusion améliorent la solubilité des
protéines recombinantes ne sont pas précisément connus. Néanmoins, plusieurs hypothèses sont
suggérées :
1) Les protéines de fusion forment des structures de type micelle : Les protéines mal repliées ou
non repliées vont être séquestrées et protégées du solvant. Aussi, le domaine soluble de la
protéine sera orienté vers l’extérieur et donc le domaine insoluble sera lui plutôt orienté vers
l’intérieur.
2) Les partenaires de fusion attirent des chaperones : L’étiquette de fusion conduit la protéine
d’intérêt dans une voie de repliement impliquant une ou plusieurs chaperones. Les étiquettes
de solubilité MBP (Maltose-binding protein) et NusA (N-utilization substance) sont deux
protéines de fusion qui utilisent ce mécanisme. Elles sont notamment connues pour interagir
avec GroEL, une chaperone présente chez E. coli (10) (11).
3) Les partenaires de fusion ont une activité intrinsèque type chaperone : Les domaines
hydrophobes de l’étiquette interagissent avec la protéine d’intérêt repliée partiellement,
empêchant ainsi l’auto-agrégation ou encore l’agrégation avec d’autres protéines. Ce
mécanisme permet ainsi le bon repliement de la protéine recombinante. Dans ce cas,
l’étiquette de fusion joue un rôle passif dans le repliement de la protéine d’intérêt, réduisant
ainsi la probabilité que la protéine s’agrège. La MBP en est un exemple, elle rentre donc dans
la catégorie 2 mais aussi dans celle-ci (12). Il est cependant difficile de faire la différence la
catégorie 2 et la catégorie 3.
4) La charge nette des protéines de fusion : Les partenaires de fusion très acides peuvent inhiber
l’agrégation protéique par répulsion électrostatique (13).
Les mécanismes que présentent les étiquettes d’expression sont donc plutôt mal connus.
Parmi le nombre important d’étiquettes qui existent à l’heure d’aujourd’hui, les plus utilisées sont
répertoriées sur la table 2, cette dernière est issue de (14). Les tailles de MBP et NusA sont
particulièrement percutantes, elles sont de 396 et 495 acides aminés respectivement. La taille de XTEN
est de 876 acides aminés, elle se rapproche donc assez bien des tailles de MBP et NusA. Le troisième
élément intéressant à remarquer est le SET (Solubility enhancing tag) ou SEP (Solubility enhancing
peptide). Les SET/SEP sont des petits peptides de moins de 20 acides aminés extrêmement solubles
et permettant d’augmenter la solubilité des protéines recombinantes, notamment grâce à leur
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
22
Table 2 Les étiquettes d’expression et de solubilité les plus utilisées à l’heure actuelle. Le nom de l’étiquette, la taille de celle-ci ainsi que le nom de la protéine associée sont répertoriés sur ce tableau. MBP, NusA et SET (encadrées en rouge) sont des étiquettes intéressantes pour le projet que nous souhaitons mettre au point.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
23
structure primaire. Cette caractéristique se rapproche assez bien de la structure primaire de XTEN, qui
justement va tendre vers une solubilité importante.
Parmi les différentes étiquettes, MBP s’avère notamment très efficace, notamment lorsque
comparé avec les étiquettes Trx (Thioredoxine) et GST (Glutathion S-transférase), cette dernière étant
utilisée pour l’expression et la purification. Ces résultats sont issus de (15) et sont présentés sur la
figure 6. Les protéines utilisées dans cette étude (TIMP, p16, E6 etc.) sont des protéines de référence
utilisées pour comparer l’efficacité des étiquettes d’expression. Malgré que l’expression de protéines
recombinantes relève toujours du cas par cas, il est quand même possible de comparer différentes
étiquettes et d’en déduire la plus efficace de manière générale. De plus, il n’existe pas d’étiquette
universelle qui fonctionne pour toutes les protéines. Ainsi, lorsqu’une étiquette est conçue, de telles
comparaisons sont toujours effectuées et il s’agit donc d’un passage obligé si l’on souhaite développer
une étiquette de type XTEN.
3) DnaK : une chaperone d’importance majeure chez E. coli
L’alternative, ou plutôt le complément à l’utilisation d’étiquettes d’expression, se présente
comme étant la co-expression de chaperones. D’après (16), les chaperones sont des protéines
assurant le bon repliement des autres protéines. Elles « protègent » les protéines contre l’agrégation
et s’assurent de dégrader les protéines mal repliées. Il existe différents types de chaperones chez E.
coli. Les plus connues et étudiées sont les chaperones de classe HSP60 et HSP70 (Heat shock-protein
60 et 70). GroEL est la HSP60 de E. coli, elle agit au niveau du repliement des protéines en créant une
cavité, les isolant ainsi du milieu extérieur. Néanmoins, la chaperone la plus importante chez E. coli
est DnaK, il s’agit de la HSP70 de E. coli. Elle permet le bon déploiement des protéines, agit sur la
désagrégation ainsi que sur le repliement. Sur la figure 7 adaptée de (17), il est possible d’observer
l’impact significatif de DnaK sur le bon repliement des protéines chez E. coli. Pour tester le niveau de
repliement des protéines en présence ou en absence de chaperone, 4 MBP reliées entre elles ont été
produites chez E. coli. Ces MBP ont ensuite été purifiées, biotinylées et fixées à des billes. Par la suite,
ces MBP ont été analysées en présence ou en absence de DnaK, et ceci par pince optique (ou optical
tweezers assay, en anglais). Cette technique consiste à étirer la construction (les 4 MBP) en appliquant
une force sur les billes. Enfin, à l’aide de calculs complexes, il est possible de déterminer l’état de
repliement des MBP. En effet, plus une protéine est repliée de manière correcte, plus celle-ci sera
difficile à déstabiliser et donc à linéariser. L’étude (17) montre donc que DnaK inhibe l’agrégation et
favorise le repliement des protéines chez E. coli. Le mécanisme derrière cette inhibition de l’agrégation
par DnaK est dû à son fort rayon hydrodynamique (18). Si malgré tout, DnaK ne parvient pas à
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
24
Figure 6 Solubilité des protéines de fusion TRX, GST et MBP en fonction de la protéine d’intérêt fusionnée à une des étiquettes utilisées (TIMP, p16, E6, CATΔ9, GFP, TEV). La solubilité de chaque protéine de fusion a été estimée grâce aux données que les auteurs de cette étude ont obtenues par quantification des bandes issues de gels SDS-PAGE (quantification par densitométrie). MBP : Maltose-binding protein, GST: Glutathion S-transferase, TRX : Thioredoxin, TIMP : Metallopeptidase inhibitor, p16 : Cyclin-dependent kinase inhibitor 2A, E6 : Human Papillomavirus (HPV) E6 protein, CATΔ9 : Chloramphenicol acetyl transferase, GFP : Green fluorescent protein, TEV : Tobacco etch virus protease.
Figure 7 DnaK empêche l’agrégation et permet le repliement correct des protéines. Les fractions de protéines dans un état natif, intermédiaire, faiblement replié ou fortement replié en absence ou en présence de DnaK sont représentées sur cette figure.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
25
permettre le bon repliement d’une protéine, elle a quand même la capacité à transférer cette même
protéine à GroEL, l’autre chaperone majeure de E. coli (19).
DnaK a suscité fortement notre intérêt. Chez E. coli, il s’agit d’un acteur majeur dans la
production de protéines recombinantes. Nous nous sommes donc intéressés sur le motif qui permet
le recrutement de DnaK. Dans une étude publiée en 1997 dans Nature Structural & Molecular Biology
(20), une équipe a récupéré des données d’une étude ayant criblé une librairie de peptides pour leur
interaction avec DnaK, ceci en utilisant le phage display. Cette librairie de peptides provient de
protéines connues pour interagir avec DnaK. À l’aide de ces données, l’équipe a établi un consensus
d’une séquence type de 13 acides aminés capable de se fixer à DnaK. Les données associées à ces
résultats sont représentées sur la figure 8.
Sur la figure 8, il est notamment intéressant de constater que le cœur hydrophobe qui
compose les peptides interagissant avec DnaK est dans beaucoup de cas constitué d’isoleucine,
leucine, valine ainsi que la tyrosine. Autour de ce cœur hydrophobes, des régions comprenant
uniquement des acides aminés basiques semblent importantes.
Depuis ces recherches concernant DnaK, il n’y a pas eu plus de précisions concernant une
région précise qui permet l’interaction avec DnaK. Néanmoins, en utilisant ce consensus, déterminer
une séquence qui interagit avec DnaK devrait être relativement simple.
En réunissant l’ensemble des données que nous avons obtenues, on peut imaginer un projet
pertinent impliquant un polypeptide type XTEN ainsi que DnaK.
4) Notre projet
Pour notre projet, nous souhaitons développer un long polypeptide type XTEN. Néanmoins, le
but n’est pas d’améliorer la durée de demi-vie de protéines médicaments. En effet, il serait plutôt
d’augmenter la solubilité des protéines recombinantes en utilisant un tel polypeptide en tant
qu’étiquette d’expression. Nous avons en effet vu que XTEN est simple à produire et soluble. Pour
continuer, d’après (9), la solubilité d’une protéine recombinante peut être améliorée en fusionnant à
celle-ci une protéine extrêmement soluble. C’est le cas de MBP et NusA qui vont jouer des rôles de
type chaperone. XTEN possède aussi ce fameux « bulking effect » qui permet de recouvrir la protéine
à laquelle il est fusionné. Ce « bulking effect » est notamment dû à la structure primaire de XTEN et à
sa taille. Dans notre cas, la caractéristique qui changerait serait la structure primaire puisque pour
XTEN, la composition en acides aminés a été déterminée en fonction de plusieurs paramètres
spécifiques des protéines médicaments (immunogénicité par exemple).
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
26
Figure 8 Pourcentage d’acides aminés contenu dans les peptides interagissant avec DnaK. a, Le motif qui permet la liaison avec DnaK consiste en un cœur comprenant 5 acides aminés hydrophobes et/ou aromatiques (Hy) et des régions flanquantes enrichies en acides aminés basiques (+). En revanche, plus la distance en partant du cœur hydrophobe est importante, moins l’incidence des résidus basiques sera importante. b, distribution en acides aminés (%) au sein des cœurs hydrophobes de 90 peptides interagissant avec DnaK (bars noires) comparée à la distribution moyenne au sein de la libraire entière utilisée pour cette étude (bars blanches).
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
27
Nous avons aussi vu que DnaK est une chaperone déterminante chez E. coli. Sa présence joue
un rôle extrêmement important sur le repliement des protéines. De plus, une séquence de seulement
15 acides aminés est primordiale pour recruter DnaK. L’ajouter sur un tel polypeptide donnerait un
aspect supplémentaire intéressant pour une étiquette d’expression. En effet, malgré que la solubilité
et le repliement soient des caractéristiques intimement proches, ils ne sont pas directement reliés. Il
faut donc agir sur ces deux aspects pour permettre de produire une protéine soluble et correctement
repliée. Ajouter une séquence de reconnaissance de DnaK serait donc un atout majeur.
L’intérêt double du polypeptide (qui jouerait donc un rôle de type chaperone) et de DnaK
pourrait permettre la conception d’une étiquette d’expression efficace, mais surtout universelle. De
façon schématique, notre construction se présenterait comme sur la figure 9.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
28
Figure 9 Notre projet : Un polypeptide long et non structuré ayant un « bulking effect » protège la protéine de l’agrégation et permet donc une production de la protéine sous forme soluble. Une séquence recrutant DnaK et située proche de la protéine recombinante permet la fixation à DnaK, et donc le bon repliement de la protéine d’intérêt. Un linker permettrait de lier la protéine d’intérêt à la séquence reconnue par DnaK.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
29
Conception de l’étiquette d’expression : DTEN
1) Structure primaire et taille de DTEN
En suivant la manière dont XTEN a été conçu, notre étiquette d’expression, qu’on nommera
DTEN, sera constituée d’une série de petites séquences peptidiques. Les acides aminés qui
composeront ces séquences seront choisis pour leur caractère soluble et pour assurer un haut niveau
d’expression de notre polypeptide. Nous devrons choisir :
Les acides aminés qui composeront notre peptide et qui vont lui conférer un maximum de
solubilité ;
Le rapport adéquat entre ces acides aminés dans toutes les petites séquences composant le
peptide final (le pourcentage de chacun des acides aminés choisis dans les séquences) ;
Le taille de ces petites séquences.
Sachant que le but de XTEN était de l’utiliser dans un contexte pharmacologique (1) (durée de
demi-vie des principes actifs), les acides aminés choisis pour sa construction ne seront donc pas
forcément adaptés pour notre DTEN.
Nous devrons alors établir une recherche bibliographique approfondie pour étudier le degré
de solubilité des acides aminés. Nous commencerons par exploiter les résultats d’une étude extensive
sur la solubilité de plusieurs acides aminés (21). Une deuxième étude a été effectuée pour classer les
acides aminés par leur degré de solubilité dans l’urée (22). Les auteurs justifient ce choix par la
contribution des groupements qui composent leurs chaines latérales. Un autre travail élaboré par les
mêmes auteurs a fourni une échelle d’hydrophobicité des acides aminés dans l’eau, l’éthanol et le
dioxane (23). Une autre étude plus récente (24) montre une méthode pour déterminer les paramètres
de la théorie statistique associée aux fluides (SAFT) pour les acides aminés.. Cette technique permet
de déterminer la solubilité de manière précise.
La deuxième méthode serait la détermination des acides aminés « solubles » à partir de la
composition en acides aminés des étiquettes de solubilité déjà utilisées. Etant donné que toutes ces
étiquettes sont issues de protéines naturelles, celles-ci contiennent forcément tous les acides aminés
naturels. Nous pourrions utiliser cette méthode pour déterminer la proportion des acides aminés les
plus abondants dans ces séquences peptidiques. On peut supposer que ces acides aminés confèrent
aux étiquettes naturelles utilisées (MBP par exemple) l’effet solubilisant sur les protéines
recombinantes fusionnées. Cela dit, il faudra vérifier que la proportion de ces acides aminés dans
toutes ces étiquettes est homogène pour confirmer leur exploitabilité. De plus, nous nous limiterons
aux 6-7 acides aminés les plus abondants pour ne pas compliquer la synthèse de la librairie de
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
30
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
31
séquences aléatoires que nous testerons par la suite (1). Une alternative plus simple serait de
déterminer la composition en acides aminés des étiquettes SET (25) ou SEP (26) connues pour
améliorer la solubilité et se baser sur celles-ci pour notre DTEN (cf introducton). Ce sont de petites
séquences peptidiques avec des caractéristiques physico-chimiques similaires. Leur taille varie de 1 à
6 acides aminés pour SEP et jusqu’à 56 acides aminés pour SET.
Il existe aussi des logiciels pouvant prédire la solubilité des peptides et des protéines. Un score
de solubilité est attribué pour chaque acide aminé et la solubilité de la protéine est obtenue en
calculant la somme des scores de tous les acides aminés qui la compose. Néanmoins, la solubilité
calculée n’inclut pas d’autres paramètres comme le pH et la température. Cet outil sera plutôt utilisé
pour avoir une idée des acides aminés impliquant des scores de solubilité élevés, mais aussi pour
vérifier qualitativement la solubilité de chacune des séquences composant notre peptide final.
Après avoir choisi les acides aminés qui vont constituer ces petites séquences peptidiques, il
faudra choisir leur taille. Des tentatives antérieures de construction de peptides de fusion non
structurés utilisant des répétitions penta peptidiques de 2-5 acides aminés ont montré une faible
solubilité de la protéine de fusion (27). Cela implique que des séquences plus longues sont nécessaires
pour obtenir des polymères longs avec une bonne solubilité. Pour la synthèse de XTEN, les auteurs
ont choisi de commencer par des séquences de 36 acides aminés (108 nucléotides). Ceux-ci étaient
composées de manière aléatoire avec les acides aminés que l’équipe a choisis. Ce choix leur a permis
d’obtenir un polypeptide final non structuré et ayant une excellente solubilité (1). Nous allons donc
choisir cette taille pour les séquences qui composeront notre peptide final.
Comme nous l’avons déjà évoqué, nous pourrons utiliser des logiciels de prédiction de
solubilité pour déterminer la proportion d’acides aminés dans nos séquences qui composeront notre
peptide final. Ils seront sélectionnés afin obtenir un maximum de solubilité tout en maintenant une
charge globale du peptide négative. En effet, il a été montré que les extensions peptidiques avec une
charge négative inhibe l’agrégation plus facilement (28).
2) DTEN et Immunogénicité
Finalement, la structure primaire choisie doit aussi dépendre du but final de DTEN, notre
polypeptide de fusion. Quel que soit la protéine recombinante produite, elle servira soit à la recherche
(production de protéines recombinantes de manière général) ou soit à des fins thérapeutiques (fusion
à des protéines médicaments). Dans le cas d’une protéine injectée à un patient, il est possible que
nous soyons obligés de garder notre polypeptide en fusion avec la protéine recombinante. Il faudra
alors déterminer si notre polypeptide est immunogène ou non. Sa composition en acides aminés sera
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
32
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
33
alors déterminante, puisqu’il a été montré que les acides aminés hydrophobes, par exemple, sont des
motifs reconnus par le complexe d’histocompatibilité majeure (MHC) de classe II (2). Nous avons choisi
alors de ne pas prendre en compte ce critère dans le choix d’acides aminés. Nous testerons l’effet
immunogène de notre polypeptide final plus tard et déterminerons si notre construction pourra servir
pour la production de protéines médicaments ou non.
4) Construction plasmidique
Nous avons choisi de construire un polypeptide de taille finale proche de 504 acides aminés
(proche de la taille d’autres protéines de fusion améliorant la solubilité comme MBP et NusA). Celui-
ci sera le produit d’assemblage de plusieurs petites séquences avec entre chacune d’elles des sites
restriction. Cela donnera une plus grande flexibilité sur la taille du polypeptide de fusion (figure 10).
DTEN sera en C-terminal (C-ter) de la protéine de fusion. Les deux seront séparés par un site de clivage
à la thrombine. Cela permettra de se débarrasser du polypeptide. En N-terminal (N-ter), nous allons
placer la séquence de recrutement de la chaperonne DnaK avec une étiquette poly-histidine pour la
purification. Un site de clivage du Tobacco Etch Virus (TEV) permettra d’obtenir la protéine de fusion
séparée de l’étiquette poly-histidine.
Nous avons choisi de positionner la séquence de recrutement de chaperonne en N-ter pour
garder un contact direct avec la protéine à produire. Ceci permettra de faciliter son repliement. Nous
avons aussi choisi de mettre DTEN en C-ter car on s’attend à ce que le peptide augmente la solubilité
en créant un effet de recouvrement (« bulking effect »). Il entourerait la protéine et empêcherait son
interaction avec d’autres protéines dans le cytoplasme. Par contre, bien évidemment, DTEN n’a
aucune affinité spécifique pour sa protéine conjuguée. Par conséquent, s’il est traduit avant la
protéine de fusion, rien ne l’empêchera d’interagir avec d’autres protéines du cytoplasme avant que
la protéine conjuguée ne soit traduite, c’est la raison pour laquelle nous placerons DTEN en C-ter.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
34
Figure 10 Modèle de vecteur de clonage et d’expression pouvant être utilisé pour exprimer DTEN avec une protéine d’intérêt. Lac I : Séquence de répression de transcription de l’opérateur Lac, Ori : Origine de réplication de E. coli. F1 ori : origine de réplication de phage, * : Sites de restriction différents de ceux présents dans le site de clonage multiple, TEV : Tobacco etch virus, His-Tag : Etiquette poly-histidine.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
35
DTEN et DnaK : Solubilité & repliement
1) Criblage d’une banque de peptides interagissant potentiellement avec DnaK
Dans l’introduction, nous avons souligné l’importance de la chaperone DnaK pour le bon
repliement des protéines chez E. coli. Aussi, comme décrit précédemment, (20) a montré qu’un
consensus de 13 acides aminés représente le motif interagissant avec DnaK (figure 8). Ce motif est
composé de 5 acides aminés hydrophobes et/ou aromatiques au centre de la séquence peptidique,
avec des régions flanquées chargées positivement. Néanmoins, pour DTEN, il n’est pas possible
d’inclure une séquence quelconque en suivant ce consensus de manière arbitraire. En effet, nous
pensons qu’il est nécessaire avant tout de cribler une banque de peptides qui intègre ce consensus
pour pouvoir choisir une séquence peptidique précise. Pour cribler une telle banque, il est possible de
générer informatiquement toutes les séquences peptidiques qui rentrent dans ce consensus. En
fonction du nombre de séquences obtenu, le criblage de toute la banque ou seulement d’une certaine
partie de celle-ci (dans le cas où la banque est trop importante) pourra se faire. Une fois la banque
générée informatiquement, la technique de choix pour une telle expérience serait le phage display.
Cette méthode est adaptée au nombre important de candidats à cribler (les peptides). De plus, elle
est très utilisée pour cribler des peptides ou des petites protéines. Elle est aussi plutôt facile à mettre
en place et peu couteuse. Le double hybride serait aussi intéressant mais plus difficile à mettre en
place, plus chère et n’est pas approprié pour étudier des interactions qui impliquent des peptides.
Ainsi, en immobilisant DnaK, il est possible de cribler les peptides qui interagissent le mieux avec la
chaperone. De cette manière, par effet entonnoir, il est possible de remonter à un faible nombre de
peptides interagissant correctement avec DnaK. Malgré tout, le phage display ne se suffit pas à lui-
même pour conclure d’une interaction protéine-protéine. De plus, le peptide n’inclut pas DTEN. En
effet, il est probable que DTEN puisse empêcher l’interaction entre DnaK et les peptides candidats.
2) Etude de l’interaction entre DTEN et DnaK
Après avoir ajouté la séquence de reconnaissance DnaK à DTEN, il faut vérifier que le
polypeptide se fixe à DnaK. Pour ce faire, il est possible de produire cette dernière et DTEN
indépendamment. DnaK peut aussi être achetée directement, chez Enzo Life Sciences par exemple.
Une fois les deux protéines obtenues, une co-immunoprécipitation peut être réalisée avec un
anticorps ciblant DnaK. De cette manière, l’interaction entre DTEN et DnaK sera vérifiée. Si le résultat
s’avère positif, une vérification supplémentaire s’impose pour une démarche scientifique rigoureuse.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
36
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
37
Ainsi, en produisant DTEN dans des bactéries E. coli exprimant DnaK (expression basale, pas de
surexpression), il est possible d’effectuer un pull-down pour vérifier que l’interaction entre les deux
acteurs se fasse. Pour ceci, il faut ajouter une étiquette de purification telle que la GST (affinité pour
le gluthation) à DTEN. Après le pull-down, un simple gel Western Blot est suffisant pour voir si les deux
protéines interagissent, de par les tailles qu’il sera possible d’observer. Ainsi, en procédant avec les
contrôles suivants, il sera possible de valider l’interaction :
Contrôle 1 : Pas de surexpression de DTEN ; Expression basale de DnaK
Contrôle 2 : Surexpression de DTEN ; Knock-out de DnaK (par CRISPR-Cas9 par exemple)
Contrôle 3 : Surexpression du peptide interagissant avec DnaK et contenant la GST ;
Expression basale de DnaK
Contrôle 4 : Surexpression de DTEN sans la séquence de reconnaissance DnaK et ; Expression
basale de DnaK
Criblage & caractérisation de DTEN
1) Méthode de criblage
Après avoir choisi 500 fragments peptidiques de 108 nucléotides chacun, nous réaliserons un
criblage dans le but de sélectionner les séquences les mieux exprimées et les plus solubles. Pour ce
faire, nous allons les coupler à la GFP. Chaque séquence sera surexprimée chez E. coli BL21 (DE3),
souche très utilisée pour la surexpression de protéines recombinantes. Grâce à la GFP, il sera possible
de quantifier la fluorescence associée à chacune des constructions. Cette méthode a été utilisée pour
XTEN (1) et permet de sélectionner les fragments les plus exprimés en comparant la fluorescence
émise par chaque construction. Les cultures associées pourront être réalisées dans des plaques 96
puits, en adaptant le matériel à cette méthode haut débit (centrifugeuse notamment). D’autres études
comme (29) ont réalisé des criblages similaires. Pour tester la solubilité de ces fragments, nous
lyserons les bactéries avant de centrifuger le lysat. Le surnagent contenant la fraction soluble sera
récupérée. Le culot contenant les protéines insolubles sera resuspendu dans de l’urée. Les deux
fractions de chaque échantillon (soluble et insoluble) seront alors analysées par SDS-PAGE afin d’avoir
une estimation de la quantité de protéines produite sous forme soluble par des mesures de
densitométrie. Nous pourrons alors estimer le pourcentage de solubilité de notre construction grâce
à l’équation suivante :
%Solubilité =(𝑄𝑢𝑎𝑛𝑡𝑖𝑡é 𝑑𝑒 𝑝𝑟𝑜𝑡é𝑖𝑛𝑒𝑠 𝑑𝑎𝑛𝑠 𝑙𝑎 𝑓𝑟𝑎𝑐𝑡𝑖𝑜𝑛 𝑠𝑜𝑙𝑢𝑏𝑙𝑒)
𝑄𝑢𝑎𝑛𝑡𝑖𝑡é 𝑑𝑒 𝑝𝑟𝑜𝑡é𝑖𝑛𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒 𝑋 100
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
38
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
39
Nous retiendrons alors les 100 séquences les plus exprimées et les 100 séquences les plus
solubles. Nous comparerons ces séquences et choisirons les 4 séquences comportant les meilleurs
taux de solubilité et d’expression. Ces 4 séquences seront ensuite combinées de manière aléatoire par
bio-informatique pour obtenir 50 fragments de 504 acides aminés (multiple de 36). Nous avons choisi
cette taille de 504 acides aminés car elle se rapproche assez bien des tailles de MBP et NusA (396 et
495 acides aminés respectivement). Nous commanderons ensuite directement les séquences, par
exemple chez General Biosystems. L’expression et la solubilité de ces fragments seront testées comme
précédemment. Finalement, 5 séquences seront retenues pour les études ultérieurs. Ces séquences
seront nommées DTEN X (X étant égal à 1, 2, 3, 4 ou 5). DTEN sera le nom de la séquence finale choisie.
Ces étapes de criblage sont particulièrement fastidieuses et seront potentiellement sous-
traitées à une entreprise ou une plateforme telle que la plateforme d’expression de protéines de EMBL
ou bien encore la plateforme automatisée de Marseille (30) (AFMB, Université d’Aix-Marseille).
Cependant, nous n’avons que peu d’informations concernant les coûts que pourrait représenter cette
sous-traitance.
2) Caractérisation des polypeptides DTEN
Pour continuer, l’effet des 5 polypeptides DTEN doit être évalué. On souhaite vérifier la
capacité des DTEN à améliorer la solubilité d’une protéine d’intérêt. De ce fait, les premières
expériences viseront à tester l’effet des polypeptides sur la solubilité d’une protéine connue. Pour
cette partie, la protéine étudiée sera la GFP. La GFP couplée à nos polypeptides sera produite encore
une fois chez E. coli BL21(DE3). Les cultures seront ensuite lysées afin de récupérer les protéines
recombinantes. Les lysats seront centrifugés afin que toutes les protéines non solubles se retrouvent
dans le culot. Les fractions solubles et insolubles seront analysées par SDS-PAGE afin d’obtenir une
estimation de la solubilité des protéines recombinantes. La procédure est donc la même que
précédemment. Encore une fois, la solubilité pourra être estimée grâce à l’équation précédente. Une
fois cette première estimation réalisée, une quantification plus précise sera réalisée par ELISA
(anticorps couplé à la HRP et ciblant la GFP).
Après cette première série de tests, nos protéines recombinantes seront purifiées à l’aide
d’une chromatographie d’affinité. Les fractions récupérées seront ensuite digérées par la protéase
TEV. Une seconde chromatographie d’affinité sera ensuite réalisée afin d’éliminer l’étiquette de
purification retirée précédemment. Les échantillons de protéines purifiées seront ensuite analysés par
diffusion dynamique de lumière (DLS) pour évaluer les niveaux d’agrégation associés aux DTEN-GFP.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
40
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
41
Cette expérience nous donnera également des informations sur le rayon hydrodynamique de nos
protéines de fusion.
Afin d’obtenir des informations sur la taille apparente de nos constructions mais aussi pour
avoir une idée sur les quantités d’agrégats, une chromatographie d’exclusion couplée à un détecteur
de diffusion de lumière multi-angle (SEC-MALS) sera également réalisée.
Etant donné que nos polypeptides DTEN sont possiblement non structurés, les techniques
conventionnelles telles que le SDS-PAGE, la DLS et le SEC-MALS ne permettent pas d’obtenir des
informations tangibles sur la taille de nos protéines. En effet la nature non structurée des polypeptides
peut modifier le « comportement » de nos protéines dans un gel SDS-PAGE ou encore en SEC-MALS.
Ces modifications sont dues à l’augmentation significative des rayons hydrodynamiques de nos
protéines de fusion. Par conséquent, le seul moyen pour obtenir la taille exacte de notre construction
est une analyse par spectrométrie de masse (MS). Grâce à cette méthode, nous pourrons alors avoir
des informations très précises sur la taille des DTEN. Les agrégats pourront également être quantifiés.
Enfin, pour vérifier la monodispersité des polypeptides, et pour obtenir des informations
structurales sur nos échantillons, une analyse de diffusion des rayons X aux petits angles (SAXS) sera
réalisée. Cette expérience permettra d’obtenir des informations sur la conformation du polypeptide
non structuré. Il sera aussi possible d’avoir une idée plus précise du « bulking effect ».
Afin de mesurer l’efficacité de nos constructions, l’ensemble des tests réalisés précédemment
seront également réalisés avec la GFP seul.
DTEN vs étiquettes d’expression actuelles
1) Etude de l’efficacité de DTEN sur plusieurs protéines peu solubles
Dans un second temps, l’efficacité de nos constructions sera testée sur une protéine connue
pour être soluble lorsque celle-ci est produite à faible température, mais insoluble lorsque celle-ci est
produite à 37°C. La protéine à tester ici sera la CAPN2 (Calpain-2 catalytic subunit) (31). CAPN2 sera
donc produite chez E. coli BL21(DE3), avec ou sans nos polypeptides DTEN, à 22°C et 37°C. Une fois les
cultures lysées et les lysats centrifugés, le surnageant sera récupéré et le culot resuspendu dans de
l’urée. Un ELISA sera alors réalisé sur les différents échantillons afin de quantifier la quantité de
protéines contenue dans chaque fraction. Grâce à l’équation précédemment citée, nous aurons alors
un pourcentage de solubilité pour nos constructions. Ce pourcentage nous permettra d’estimer
l’efficacité des DTEN dans cette situation. Après cette première expérience, les fractions solubles de
nos protéines seront analysées par SDS-PAGE pour observer la présence ou non d’agrégats. Les
protéines seront ensuite purifiées de la même manière que précédemment. Les échantillons purifiés
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
42
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
43
seront alors analysés par DLS pour vérifier la monodispersité des solutions protéiques. Pour évaluer
le niveau d’agrégation des échantillons, une analyse SEC-MALS sera également réalisée. Une MS sera
ensuite effectuée afin de vérifier l’intégrité de nos échantillons. Cette MS permettra de quantifier nos
protéines et déterminera quelle est la condition la plus efficace pour produire la protéine CAPN2.
L’ensemble de ces tests seront réalisés avec des longueurs différentes pour chacun des polypeptides
testés. Cela nous permettra de trouver s’il y a une corrélation entre la taille des polypeptides et la
solubilité de CAPN2.
Nos constructions seront ensuite testées sur un ensemble de 14 protéines connues pour être
non solubles et n’ayant pas de domaines transmembranaires (32). Les protéines testées seront MAR
1 (NAD-dependent histone deacetylase SIR2), Q9UH52 (Mitochondrial import receptor subunit TOM6
homolog), SMPX (Small muscular protein), Q9UMT3 (YRO protein tyrosine kinase-binding protein),
Q9Y260 (ABP/ZF), SAA (Serum amyloid A-1 protein), BC10 (Bladder cancer-associated protein ), NCYM
(N-cym protein), Q9UMZ1 (Prothymosin a14), MCS (la Cyclin mcs2), DAP1 (la Cytochrome P450
regulator), RPP14 (Ribonuclease P protein subunit p14), BTG1 (la Protein BTG1) et PPR8 (
Pentatricopeptide repeat-containing protein 8). L’ensemble de ces protéines est connu pour avoir des
taux de solubilité inférieurs à 33% (32). La HSP1 (Heat shock protein 90) sera quant à elle utilisée
comme contrôle car son taux de solubilité est proche de 100%. L’ensemble de ces protéines seront
produites chez E.coli BL21(DE3). Comme pour les expériences précédentes, un test de solubilité sera
réalisé par ELISA sur les fractions solubles et insolubles, puis des expériences de DLS et SEC-MALS
quantifieront le degré d’agrégation dans les solutions protéiques. Les produits obtenus en fin de
purification seront analysés par MS pour déterminer précisément la nature des échantillons et
quantifier les protéines obtenues. L’ensemble de ces tests sera réalisé avec des longueurs différentes
pour chacun des DTEN testés. Cela nous permettra de trouver s’il y a une corrélation entre la taille des
polypeptides et la solubilité de ces protéines.
2) DTEN vs étiquettes d’expression conventionnelles
Pour comparer l’efficacité de nos constructions à celles des étiquettes de solubilités utilisées
fréquemment, les mêmes expériences seront réalisées en remplaçant nos constructions par des
étiquettes de solubilité déjà testées sur ces protéines. Les étiquettes testées seront le tag 6xHis (6
histidines, His-tag), la GST, NusA, l’étiquette synthétique de la région liant les chaines lourdes au
domaine B de la protéine A (ZZ) / le fragment Gb1 de la protéine G (Gb1) / la MBP et la Thioredoxine
(Trx). La comparaison de la capacité de solubilisation de ces différentes étiquettes nous permettra de
juger de l’efficacité de nos polypeptides DTEN.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
44
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
45
3) Etude de l’impact de DTEN sur l’activité de la luciférase rénilla
Une fois l’efficacité des DTEN démontrée, nous devrons montrer que nos polypeptides
n’entraveront pas l’activité les protéines auxquelles ils seront liés. Pour cela, des tests d’activité sur
différentes protéines seront réalisés. Le premier test consistera à coupler une enzyme, la luciférase
rénilla, à nos constructions afin de tester son activité en présence de DTEN. La protéine sera produite
chez E.coli BL21(DE3), à 37°C. La luciférase rénilla couplée aux différents DTEN sera ensuite purifiée
par chromatographie d’affinité et quantifier par ELISA. L’activité de notre enzyme sera obtenue en
quantifiant la fluorescence d’une concentration définie de luciférase après ajout de la coelenterazine.
Le résultat obtenu sera comparé à l’activité de la même concentration de luciférase rénilla non
couplée aux polypeptides DTEN. Si une différence significative est trouvée, le même test sera réalisé,
avec cette fois-ci des polypeptides DTEN de tailles plus petites. Nous observerons ainsi s’il y a une
corrélation entre la taille du polypeptide et l’activité de la luciférase rénilla.
4) Impact de DTEN sur les interactions protéines-protéines et protéines-acides
nucléiques
Pour continuer, nous testerons les interactions protéine-protéine en présence de DTEN. Pour
cela, nous exprimerons la protéine NleH1 couplée à nos polypeptides et la protéine RPS3 (sans DTEN)
chez E. coli. Ces deux protéines sont connues pour interagir et être produites facilement chez E. coli
(33). Une fois les protéines purifiées, l’interaction sera vérifiée une première fois par co-
imunoprécipitation (Co-IP). Ensuite, l’interaction sera quantifiée par analyse de résonances de surface
plasmonique (SPR). Dans cette expérience, RPS3 sera fixé sur le support, et des concentrations de plus
en plus importantes de NleH1 couplé aux DTEN seront ajoutées. La quantification de cette interaction
nous indiquera de manière très précise si nos polypeptides DTEN inhibent les interactions protéine-
protéine. L’ensemble de ces tests seront réalisés avec des longueurs différentes pour chacun des
polypeptides testés. Cela nous permettra de trouver s’il y a une corrélation entre la taille des
polypeptides et l’efficacité d’interaction entre nos protéines d’intérêt.
De la même manière, Il est possible que l’activité d’une protéine dépende de son affinité à
l’ADN ou ARN. Pour tester cette interaction nous produirons la Taq DNA Polymérase fusionnée aux
DTEN. Une fois la protéine obtenue, nous réaliserons une quantitative Polymérase Chain Reaction
(qPCR) sur une séquence d’ADN modèle, comme la séquence d’ADN qui code pour la GFP. La même
qPCR sera réalisée avec une Taq DNA Polymérase produite sans DTEN. La différence de produit PCR
obtenue nous permettra d’observer l’effet des polypeptides sur les interactions ADN-protéines.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
46
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
47
Comme précédemment, différentes tailles de polypeptides pourront être utilisées pour voir si la taille
du polypeptide joue sur l’activité de la Taq Polymérase.
5) Détermination des meilleurs ratio activité / solubilité
On peut éventuellement se trouver dans le cas où on trouve une corrélation positive entre la
taille de DTEN et la solubilité des protéines auxquelles ils sont fusionnés. Par contre, une corrélation
négative avec l’activité de ces mêmes protéines peut également être constatée. Cela pourrait être dû
à un encombrement stérique dû à la taille de DTEN. Celui-ci empêcherait alors la protéine fusionnée
de reconnaitre son ligand. Dans ce cas, Il faudra trouver un équilibre entre activité et solubilité de la
protéine conjuguée. Cet équilibre dépendra principalement de la taille de notre polypeptide. Pour
tester cet équilibre nous fusionneront des polypeptides de longueurs différentes à des protéines
d’intérêt et nous testerons leurs activités ainsi que leur solubilité.
La S-peroxidase (CWPO_C de Populus alba) produite chez E. coli n’est pas soluble mais peut être
purifiée lorsque produite en corps d’inclusion (34). Nous allons donc essayer de la produire
directement soluble grâce à nos constructions. Nous produirons chez E. coli BL21 différentes protéines
de fusions avec différentes tailles de polypeptides DTEN. Après avoir lysé les cultures, nous testerons,
dans un premier temps, la solubilité de nos protéines en réalisant un ELISA sur les fractions solubles
et insolubles de nos lysats. Cet ELISA sera réalisé avec des anticorps secondaires couplés à la GFP (au
lieu de la HRP) afin d’éviter que le résultat soit faussé par l’activité de notre échantillon (S-peroxidase).
Une fois les protéines purifiées, nous réaliserons un test d’activité enzymatique sur la peroxydase en
quantifiant la colorimétrie à 492 nm après ajout de 3,3′,5,5′-Tetramethylbenzidine (TMB). L’état
d’agrégation sera quantifié comme précédemment par DLS, SDS-PAGE et SEC-MALS. Une dernière
étape de MS sera réalisée pour vérifier la taille de nos protéines. Nous pourrons alors déterminer la
taille de nos polypeptides optimale pour avoir le meilleur rapport activité enzymatique / solubilité.
Sur le même principe nous allons chercher la taille optimale de nos polypeptides DTEN pour
avoir une protéine soluble qui conserve son interaction protéine / protéine. La protéine SAA est
connue pour interagir avec la Cystatine C (35). Toujours en testant différentes tailles de polypeptides
DTEN, la SAA sera produite en utilisant E. coli BL21 cultivée à 37°C. Les lysats seront séparés en
fractions solubles et insolubles comme vu précédemment. Les quantités de nos protéines d’intérêt
dans chaque fraction seront estimées par ELISA. Les protéines seront purifiées par chromatographie
d’affinité. L’interaction entre SAA et la Cystatine sera testée par Co-IP et SPR. Nous réaliserons
également des analyses par DLS, SDS-PAGE, SEC-MALS et MS pour obtenir des informations sur l’état
d’agrégation des protéines et pour vérifier que les constructions que nous étudions soient bien celles
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
48
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
49
que nous attendions. Après analyse des données obtenues, nous pourrons alors trouver la taille
optimale de notre polypeptide pour conserver à la fois le maximum de solubilité et l’activité de notre
protéine d’intérêt.
Nous étudierons ensuite la taille optimale de nos polypeptides DTEN pour conserver
l’interaction ADN / ARN-protéine et une bonne solubilité de ces protéines. RPP14 est une Ribonucléase
qui dégrade l’ARN (36). En testant différentes tailles de polypeptide, nous produirons RPP14 à partir
d’E. coli BL21 cultivée à 37°C. Les fractions solubles et insolubles seront séparées, et une quantification
de RPP14 par ELISA sera réalisée sur chaque fraction. Une fois la protéine purifiée, nous réaliserons
un gel retard pour déterminer la conservation de l’interaction entre L’ARN et RPP14. Des séquences
d’ARN marquées au phosphate 32 seront ajoutées à RPP14. Le mélange sera ensuite analysé par gel
retard. Les résultats obtenus sur le gel nous permettrons ainsi de vérifier que RPP14 interagit toujours
avec l’ARN. L’interaction ARN-RRP14 sera quantifiée par SPR. L’ARN sera fixé à un support métallique
et des concentrations croissantes de RRP14 seront ensuite ajoutées à des intervalles réguliers. Cette
quantification nous donnera la taille optimale du polypeptide DTEN pour avoir le meilleur ratio activité
/ solubilité.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
50
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
51
Conclusion & Perspectives
L’objectif de notre projet est de concevoir une étiquette de solubilité qui aurait une efficacité
supérieure par rapport aux étiquettes déjà disponibles. DTEN, grâce à sa longue chaine
polypeptidique, devrait permettre d’isoler les protéines recombinantes du reste du cytoplasme et
donc de faciliter le repliement des protéines. Sa composition en acides aminés solubles permettra
d’assurer une importante solubilité. La présence d’une séquence de reconnaissance de la chaperonne
DnaK favorisera le repliement des protéines grâce à son effet de recouvrement et sa capacité à
recruter d’autres chaperones qui auront des effets positifs sur le repliement des protéines.
Une telle étiquette de solubilisation présenterait de nombreuses applications possibles. Par
exemple, elle pourrait être utilisée dans un contexte purement scientifique pour faciliter la production
de protéines insolubles, comme les facteurs de transcription par exemple. Il pourrait aussi être couplé
à des protéines utilisées dans le milieu industriel pour éviter les phénomènes d’agrégation et ainsi
augmenter le rendement de production. DTEN devrait alors rester fusionné à la protéine d’intérêt.
Dans ce cas, il sera important de conserver l’activité de la protéine d’intérêt. Dans le cas DTEN aurait
un effet négatif sur l’activité de la protéine fusionnée, il sera important de trouver un compromis entre
solubilité, agrégation et activité protéique. La longueur du polypeptide devra alors être modulée.
Cette modulation sera grandement simplifiée par la présence de nombreux sites de restriction
présents dans la séquence de nos polypeptides DTEN potentiellement non structurés.
Il est fort probable que dans le futur, DTEN soit couplé à des protéines thérapeutiques peu
solubles. La protéine de fusion complète devra alors être administré au patient. Des études
d’immunogénicité devront être réalisées chez l’animal puis sur l’Homme. Ces études cliniques
influenceront grandement sur le devenir de DTEN, qui pourra soit devenir un produit pouvant être
utilisé au sein de l’industrie pharmaceutique, ou soit devenir un outil de biotechnologies spécialisé
pour la production de protéines insolubles.
De nombreux marchés sont donc exploitables, et nous pourrons donc adapter notre produit
en fonction des caractéristiques finales de DTEN. Si DTEN obtient des résultats concluants par rapport
à la solubilité et l’agrégation, nous pourrons breveter la technologie.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
52
Bibliographie
1. A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner.
Schellenberger, V. Nature Biotechnology, Vol. 27(12), pp. 1886-1190.
2. Motifs and supermotifs for MHC class II binding peptides. Sinigaglia, F. 1995, The Journal of
Experimental Medicine, Vol. 1181, pp. 449-451.
3. Efficient expression of full-length antibodies in the cytoplasm of engineered bacteria. Robinson, M.P.
2015, Nature Communications, Vol. 6, pp. 72-80.
4. Structural genomics of human proteins: target selection and generation of a public catalogue of
expression clones. Bussow, K. 2005, Microbial Cell Factories, Vol. 4, p. 21.
5. A screening strategy for heterologous protein expression in Escherichia coli with the highest return
of investment. Pacheco, B. 2012, Protein Expression and Purification, Vol. 81, pp. 33 - 41.
6. Solubilization and refolding of bacterial inclusion body proteins. Singh, S. 2005, Journal of Bioscience
and Bioengineering, Vol. 994, pp. 303 - 310.
7. Protein aggregation and its inhibition in biopharmaceutics. Wang, W. 2004, International Journal of
Pharmaceutics, Vol. 289, pp. 1 - 30.
8. Refolding techniques for recovering biologically active recombinant proteins from inclusion bodies.
Yamagushi, H. 2014, Biomolecules, Vol. 41, pp. 235-251.
9. Fusion tags for protein solubility, purification and immunogenicity in Escherichia coli: the novel Fh8
system. Costa, S. 2014, Frontiers in Microbiology, Vol. 5, p. 63.
10. Mechanisms for GroEL/GroES-mediated folding of a large 86-kDa fusion polypeptide in vitro.
Huang, Y.S. 1999, The Journal of Biological Chemistry, Vol. 27415, pp. 10405-10412.
11. Escherichia coli fusion carrier proteins act as solubilizing agents for recombinant uncoupling protein
1 through interactions with GroEL. Douette, P. 2005, Biochemical and Biophysical Research
Communications, Vol. 333 (3), pp. 686-693.
12. Mutations that alter the equilibrium between open and closed conformations of Escherichia coli
maltose-binding protein impede its ability to enhance the solubility of passenger proteins.
Nallamesetty, S. 2007, Biochemical and Biophysical Research Communications, Vol. 364 (3), pp. 639 -
644.
13. The acidity of protein fusion partners predominantly determines the efficacy to improve the
solubility of the target proteins expressed in Escherichia coli. Su, Y. 2007, Journal of Biotechnology,
Vol. 129 (3), pp. 373 - 382.
14. Tagging for protein expression. Malhotra, A. 2009, Methods in Enzymology, Vol. 129 (3), pp. 373-
382.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
53
15. Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of
polypeptides to which it is fused. Kapust, R.B. 1999, Protein Science, Vol. 8 (8), pp. 1668 - 1674.
16. Chaperone machines for protein folding, unfolding and disaggregation. Saibil, H. 2015, Nature
Reviews Molecular Cell Biology, Vol. 14 (10), pp. 630 - 642.
17. Alternative modes of client binding enable functional plasticity of Hsp70. Mashaghi, A. 2016,
Nature, Vol. 539 (7629), pp. 448 - 451.
18. Heterogeneous binding of the SH3 client protein to the DnaK molecular chaperone. Lee, J.H. 2015,
PNAS, Vol. 112 (31), pp. 4206 - 4215.
19. DnaK functions as a central hub in the E. coli chaperone network. Calloni, G. 2012, Cell Reports,
Vol. 1 (3), pp. 251-264.
20. Interaction of Hsp70 chaperones with substrates. Rüdiger, S. 1997, Nature Structural & Molecular
Biology, Vol. 4 (5), pp. 342 - 349.
21. The solubility of the amino acids in water. Max, S. 1933, Journal of Biological Chemistry, Vol. 103 ,
pp. 579 - 595.
22. The solubilty of Amino Acids and related compounds in aqueous urea solutions. Nozaki, Y. 1963,
Journal of Biocehmistry, Vol. 103, pp. 579 - 595.
23. The solubility of amino acids and two glycine peptides in aqueous ethanol and diaxone solutions.
Nozaki, Y. 1971, Journal of biological chesmistry, Vol. 246 (7), pp. 2211-2217.
24. Solubility of amino acids in water and aqueous solutions by the statistical assocoating fluid theory.
Ji, P. 2008, Industrial and Engineering Chemistry Research, Vols. 103-1933, pp. 579-595.
25. A solubility enhancing tag (SET) for NMR studies of poorly behaving proteins. Zhoua, P. 2001,
Journal of biomolecular NMR, Vol. 20, pp. 11 - 14.
26. Mutational analysis of protein solubility enhancement using short peptide tags. Kato, A. 2007,
Bioploymers, Vol. 85 (1), pp. 12 - 18.
27. Fusion of a recombinant antibody fragment with a homo-amino-acid polymer: effects on
biophysical properties and prolonged plasma half-life. Schlapschy, M. 2007, Prtoein Engineereing,
Design and Selection, Vol. 20 (6), pp. 273 - 284.
28. Protein aggregation during overexpression limited by peptide extensions with large net negative
charge. Zhang, YB. 2004, Protein Expression and Purification, Vol. 36 (2), pp. 207 - 216.
29. High-throughput screening of soluble recombinant proteins. Shih, Y.S. 2002, Protein Sciences, Vol.
11 (7), pp. 1714 - 1719.
30. High Throughput Quantitative Expression Screening and Purification Applied to Recombinant
Disulfide-rich Venom Proteins Produced in E. coli. Saez, N.J. 2014, The Journal of Visualized
Experiments, Vol. exp(89), p. e:51464.
VERS UNE ETIQUETTE D’EXPRESSION INNOVANTE – LOÏC, NOUR & AMINE
54
31. Efficient expression and purification of recombinant human m-calpain using an Escherichia coli
expression system at low temperature. Hata, S. 2012, The Journal of Biochemistry, Vol. 18 (9), pp. 753-
763.
32. Rapid screening for improved solubility of small human proteins produced as fusion proteins in
Escherichia coli. Hammarström, M. 2002, Protein Sciences, Vol. 11 (2), pp. 313-321.
33. Escherichia coli virulence protein NleH1 interaction with the v-Crk sarcoma virus CT10 oncogene-
like protein (CRKL) governs NleH1 inhibition of the ribosomal protein S3 (RPS3)/nuclear factor κB (NF-
κB) pathway. Pham, T.H. 2013, The Journal of Biological Chemistry, Vol. 288 (48), pp. 34567 - 34574.
34. Optimized refolding and characterization of S-peroxidase (CWPO_C of Populus alba) expressed in
E. coli. Pham, T.M. 2011, Protein Expression and Purification, Vol. 80 (2), pp. 268 - 273.
35. Interaction of serum amyloid A with human cystatin C--assessment of amino acid residues crucial
for hCC-SAA formation (part II). Spodzieja, M. 2013, Journal of Molecular Recognition, Vol. 26 (9), pp.
415 - 425.
36. A protein subunit of human RNase P, Rpp14, and its interacting partner, OIP2, have 3′→5′
exoribonuclease activity. Jiang, T. 2002, PNAS, Vol. 99 (8), pp. 5295 - 5300.