BIO-INFORMATIQUE POUR LA GÉNOMIQUE

download BIO-INFORMATIQUE POUR LA GÉNOMIQUE

of 258

Transcript of BIO-INFORMATIQUE POUR LA GÉNOMIQUE

FRDRIC RAYMOND

BIO-INFORMATIQUE POUR LA GNOMIQUE ET LE DIAGNOSTIC DES MALADIES INFECTIEUSES

Thse prsente la Facult des tudes suprieures de lUniversit Laval dans le cadre du programme de Doctorat en physiologie-endocrinologie pour lobtention du grade de Philosophi doctor (Ph. D.)

DPARTEMENT DE BIOLOGIE MDICALE FACULT DE MDECINE UNIVERSIT LAVAL QUBEC

2011

Frdric Raymond, 2011

RsumLe squenage du gnome dun microorganisme est un jalon important dans ltude de sa biologie. Quel que soit cet organisme, les outils bio-informatiques ncessaires pour comprendre son gnome et le comparer aux autres gnomes squencs seront similaires. Dans cette thse, lADN gnomique de parasites et de virus est mis profit afin de mieux comprendre ces microorganismes. Dans un premier temps, le parasite protozoaire Leishmania est tudi par transcriptomique et par gnomique comparative afin de mieux comprendre son infectivit, sa rsistance aux antiparasitaires et son mode de vie dimorphique. Ce parasite alterne entre le stade flagell (promastigote) et le stade intracellulaire aflagell (amastigote). Afin de faciliter lanalyse par biopuces du transcriptome de Leishmania, un systme de gestion et danalyse de donnes de biopuces a t conu. Quatre tudes utilisant ce systme sont prsentes sommairement et leurs implications sont discutes. Deuximement, le gnome de lespce Leishmania (sauroleishmania) tarentolae, qui nest pas pathogne pour lhumain, a t squenc et compar trois espces infectant lhomme. Cette tude a montr que, mme si peu de gnes diffrencient les espces, L. tarentolae possde moins de gnes associs au stade amastigote que les autres espces. Deux familles de gnes ont t trouves en nombre de copies leves chez L. tarentolae : GP63 et PSA31C. Ces rsultats permettent une meilleure comprhension de la biologie de L. tarentolae et de la virulence des autres espces de Leishmania. Dans un deuxime temps, les squences des gnomes de virus respiratoires disponibles dans les bases de donnes publiques ont t analyses pour crer un test diagnostique permettant la dtection et lidentification de 25 types de virus respiratoires, dont la grippe A (H1N1) responsable de la pandmie de 2009 et la grippe aviaire A (H5N1). Le test a t valid avec des chantillons de laboratoire et avec des chantillons cliniques. Mme si ltude du parasite Leishmania tait indpendante de celle des virus respiratoires, les approches utilises pour ces deux projets taient similaires. Ainsi, la bio-informatique est un outil essentiel en microbiologie, car elle est indispensable pour rsoudre des problmes de diverses natures chez des organismes diffrents.

ii

AbstractSequencing a genome is a milestone in the study of an organism. Bioinformatics allow both to better understand single organisms and to compare them to related species through comparative genomics. This thesis centers on the idea that genome sequence of parasites and viruses can be used in various ways to better understand these microorganisms. Transcriptomics and comparative genomics were used to study the protozoan parasite Leishmania in order to better understand its virulence, its resistance to antiparasitic drugs, and its dimorphic life-cycle, which includes a flagellated free form named promastigote and an aflagellate intracellular form named amastigote. In order to study gene expression in Leishmania, an integrated management and analysis system was created, along with protocols designed for Leishmania microarrays analysis. Four studies using this system are briefly described. In another study, the genome of Leishmania (sauroleishmania) tarentolae, a lizard parasite, was sequenced and compared to human pathogenic Leishmania species. This study showed little difference between the Leishmania species, although L. tarentolae seems to contain less genes associated to the amastigote life-cycle, including the amastin gene. Two gene families were highly expanded in L. tarentolae: the surface metalloprotease GP63 and the promastigote antigen protein PSA31C. These results provide a better understanding of L. tarentolae biology and give insights on the genes involved in virulence in pathogenic Leishmania species. The second part of this thesis concerns the creation of a molecular diagnostic assay for the detection and identification of 25 respiratory virus types, including the influenza A/H1N1 pandemic strain and the avian influenza A/H5N1 strain. This assay was created by analyzing genome sequences available from public repositories and it was afterwards tested on laboratory and clinical virus strains. Although Leishmania and respiratory viruses are distantly related, the approaches used in both projects were similar. Thus, bioinformatics is an essential and ubiquitous science that allows to solve problems in different areas (omics) of biology.

Avant-proposEn 1990, la population de la plante est dcime 99,4 % par un supervirus chapp dun centre de recherche de larme amricaine. Ce moment, mme sil est fictif, a fait natre en moi une grande curiosit pour les maladies infectieuses. Depuis ma premire lecture du roman Le Flau, de Stephen King, jai su que jorienterais ma carrire vers la recherche en microbiologie. Au fil des ans, dautres uvres de fiction ont modul mon choix de carrire, notamment les bandes dessines amricaines X-Men, avec leurs constantes rfrences la gntique. Des projets comme ceux auxquels jai eu la chance de participer au cours de mes travaux de doctorat mont permis, par leur nature la pointe des technologies biomdicales, dtudier les maladies infectieuses dun point de vue aussi fascinant que celui des docteurs Henry McCoy, Nathaniel Essex et Mora McTaggert, qui ont habit mon imaginaire depuis que je sais lire. Sans Stephen King et Chris Claremont, jaurais peut-tre choisi une autre voie. De retour la ralit, je remercie Jacques Corbeil, mon directeur de recherche, qui ma permis de participer tous ces projets fascinants et qui, avec son enthousiasme et son esprit visionnaire, ma dirig pendant mon doctorat. La libert quil ma laisse pour mener mes projets ma permis de mpanouir pendant mes tudes de troisime cycle. Merci Lynda Robitaille, prsence indispensable dans le laboratoire, sans qui beaucoup de projets auraient t trs compliqus. Merci Sbastien Boisvert, pour ses talents de bioinformaticien, qui a grandement facilit plusieurs des travaux prsents dans cette thse. Merci Nancy Boucher, qui ma beaucoup aid dans le laboratoire et qui ma fait rire. Merci Jessyka Fortin pour sa connaissance approfondie de la PCR en temps rel. Merci Mlissa Sirois, pour toutes les discussions. Merci ric Madore, pour son humour et ses comptences dans le domaine des biopuces. Merci Thibault Varin, pour les fucking lie et autres musiques tonitruantes. Merci Ren Paradis, pour son support informatique et sa connivence musicale. Merci toute la gang de bio-informatique de lpoque Complan. Merci au btiment Complan, pour mavoir inspir un roman dhorreur. Merci Marc Ouellette et Barbara Papadopoulou, pour leur collaboration et leurs commentaires tout au long des projets dcrits dans cette thse. Merci Danielle Lgar,

iv ressource essentielle en gnomique de Leishmania. Merci Gatan Roy pour son support dans le projet de squenage de L. tarentolae. Merci Jean-Michel Ubeda, pour ces projets fascinants au cours desquels nous avons collabor, mme sils ne sont pas tous inclus dans cette thse. Merci Annie Rochette, pour sa collaboration dans lanalyse de ses donnes. Merci aux autres leishmanieux avec qui jai eu la chance de travailler. Merci Guy Boivin et son quipe, en particulier Julie Carbonneau et Marie-ve Hamelin, pour leur support dans les projets de diagnostic molculaire dinfections respiratoires virales. Finalement, je remercie mes parents, qui mont toujours encourag et qui mont souvent montr la fiert quils ressentaient concernant mon choix de carrire. Merci Caroline, mon pouse adore, qui, en plus de mavoir encourag tout au long de mes tudes universitaires, a mis mon service ses comptences de rviseure linguistique chaque fois que jen avais besoin, en particulier pour rviser cette thse. Merci Lauriane, qui ne ma pas toujours laiss travailler, mais qui a toujours ensoleill mes journes par sa petite binette. Merci la famille et aux amis qui se sont tenus au courant de mes progrs tout au long de mes tudes. Je remercie les Instituts de recherche en sant du Canada pour le financement de mes tudes de doctorat. Merci au parasite Leishmania qui ma montr que tout sujet est intressant si lon pose les bonnes questions.

v

ContributionsCette section prsente la description de mes contributions aux diffrents projets prsents dans cette thse de doctorat. Le chapitre 4 prsente la cration dun systme de gestion et danalyses de donnes de biopuces utilises pour ltude du parasite Leishmania. Au cours de ces travaux, jai cr le concept de LMMAP et rdig les spcifications du logiciel. Jai ensuite supervis Sbastien Boisvert dans la programmation du logiciel. Jai cr les protocoles de normalisation et danalyse des biopuces Leishmania. Finalement, jai conseill les utilisateurs de la biopuce dans la conception de leurs expriences, fait la normalisation et lanalyse statistiques des donnes et propos des analyses supplmentaires pour les articles numrs dans lannexe 1. Le chapitre 5 dcrit le gnome de Leishmania tarentolae. Pour ce projet, jai supervis et valid lassemblage du gnome, jai ralis lannotation du gnome et jai effectu les analyses de gnomique comparative. Finalement, jai fouill les rsultats de gnomique comparative afin de trouver les diffrences majeures entre L. tarentolae et les autres espces de Leishmania. Jai supervis et analys les expriences de validation (biopuce et Southern). Jai rdig la premire version de cet article et je lai retravaill sous la supervision de Marc Ouellette, Barbara Papadopoulou et Jacques Corbeil. Les chapitres 7, 8 et 9 dcrivent un test de diagnostic molculaire permettant de dtecter 25 virus respiratoires dans des chantillons cliniques. Pour ce projet, jai conu le test diagnostique sur biopuce ainsi que le test de PCR en temps rel. Jai particip loptimisation du test ainsi qu sa validation. Jai mis jour le test pour la dtection de la grippe A (H1N1) pandmique et jai supervis son optimisation et sa validation. Jai rdig le chapitre 7 sous la supervision de Jacques Corbeil. Jai rdig les deux articles portant sur ce sujet sous la supervision de Guy Boivin et Jacques Corbeil.

vi mes parents

Table des matiresRsum.....................................................................................................................................i Abstract .................................................................................................................................. ii Avant-propos ........................................................................................................................ iii Contributions .......................................................................................................................... v Table des matires ............................................................................................................... vii Liste des tableaux.................................................................................................................... x Liste des figures .....................................................................................................................xi 1. Introduction ..................................................................................................................... 1 2. Le parasite Leishmania ................................................................................................... 5 2.1. La rpartition territoriale de la leishmaniose ............................................................... 5 2.2. Les types de leishmaniose............................................................................................ 6 2.3. Le parasite Leishmania ................................................................................................ 7 2.3.1. Les Leishmania (leishmania) ................................................................................ 8 2.3.2. Les Leishmania (vianna) ...................................................................................... 8 2.3.3. Les Leishmania (sauroleishmania) ....................................................................... 9 2.3.4. Les autres espces de trypanosomatides ............................................................... 9 2.4. Les antiparasitaires et la rsistance ............................................................................ 10 2.5. Le cycle de vie et linfection...................................................................................... 13 2.5.1. Lenvironnement et la diffrenciation du parasite .............................................. 14 2.5.2. Les Leishmania et la rponse immunitaire ......................................................... 17 2.6. Le gnome de Leishmania ......................................................................................... 19 2.6.1. La gnomique comparative ................................................................................. 20 2.6.2. La rgulation de la transcription ......................................................................... 26 2.6.3. Ltude du transcriptome de Leishmania............................................................ 28 3. La gnomique et la bio-informatique............................................................................ 31 3.1. Le squenage de gnomes ........................................................................................ 31 3.1.1. Le squenage en aveugle................................................................................... 32 3.1.2. Les mthodes haut dbit ................................................................................... 33 3.1.3. Lassemblage de gnomes .................................................................................. 37 3.1.4. Lannotation de gnomes .................................................................................... 42 3.2. La transcriptomique et les biopuces........................................................................... 45 3.2.1. Le principe des biopuces..................................................................................... 45 3.2.2. Les types de biopuces ......................................................................................... 46 3.2.3. La conception dune exprience ......................................................................... 47 3.2.4. La normalisation et lanalyse statistique ............................................................. 48 3.2.5. Les autres applications des biopuces .................................................................. 52 4. La bio-informatique pour analyser les biopuces Leishmania ....................................... 54 4.1. La gestion des donnes haut dbit........................................................................... 55 4.2. Lanalyse des donnes haut dbit............................................................................ 56 4.3. La biopuce Leishmania .............................................................................................. 57 4.3.1. La premire gnration ....................................................................................... 57 4.3.2. La deuxime gnration ...................................................................................... 58 4.4. Le protocole danalyse ............................................................................................... 58 4.4.1. Lassociation entre les sondes et les gnes ......................................................... 59

viii 4.4.2. La pondration des sondes .................................................................................. 62 4.4.3. Le protocole danalyse de la biopuce de premire gnration ............................ 62 4.4.4. Le protocole danalyse de la biopuce de seconde gnration ............................. 63 4.5. Le systme informatique de gestion de laboratoire ................................................... 63 4.6. Les forces et les faiblesses de LMMAP ..................................................................... 67 4.7. Les tudes publies utilisant la biopuce Leishmania ................................................. 68 4.8. La figure ..................................................................................................................... 71 5. Le gnome de Leishmania tarentolae ........................................................................... 72 5.1. Le rsum de larticle ................................................................................................ 72 5.1.1. Le rsum en franais ......................................................................................... 72 5.1.2. Abstract ............................................................................................................... 73 5.2. Larticle ...................................................................................................................... 74 5.2.1. Introduction ......................................................................................................... 75 5.2.2. Materials and methods ........................................................................................ 76 5.2.3. Results ................................................................................................................. 80 5.2.4. Discussion ........................................................................................................... 89 5.2.5. Acknowledgments .............................................................................................. 93 5.2.6. Tables .................................................................................................................. 95 5.2.7. Figures .............................................................................................................. 117 6. Le diagnostic molculaire des infections respiratoires virales ................................... 126 6.1. Les infections respiratoires ...................................................................................... 126 6.2. Le diagnostic des infections respiratoires ................................................................ 129 6.2.1. Les mthodes utilisant la culture ou limmunologie ......................................... 129 6.2.2. Les mthodes utilisant la dtection dacides nucliques .................................. 130 7. La conception dun test diagnostique ......................................................................... 134 7.1. Le rsum du chapitre de livre ................................................................................. 134 7.2. Le chapitre ............................................................................................................... 135 7.2.1. Introduction ....................................................................................................... 136 7.2.2. Principle of the assay ........................................................................................ 138 7.2.3. Assay design ..................................................................................................... 139 7.2.4. Validation of the assay ...................................................................................... 143 7.2.5. Conclusion ........................................................................................................ 146 7.2.6. Tables ................................................................................................................ 147 8. Le diagnostic molculaire automatis des virus respiratoires .................................... 149 8.1. Le rsum de larticle .............................................................................................. 149 8.1.1. Le rsum en franais ....................................................................................... 149 8.1.2. Abstract ............................................................................................................. 150 8.2. Larticle .................................................................................................................... 151 8.2.1. Introduction ....................................................................................................... 152 8.2.2. Methods ............................................................................................................ 153 8.2.3. Results ............................................................................................................... 157 8.2.4. Discussion ......................................................................................................... 159 8.2.5. Acknowledgements ........................................................................................... 161 8.2.6. Tables ................................................................................................................ 163 8.2.7. Figure ................................................................................................................ 170 9. Le diagnostic molculaire de la grippe A (H1N1) ...................................................... 171 9.1. Le rsum de larticle .............................................................................................. 171

ix 9.1.1. Le rsum en franais ....................................................................................... 171 9.1.2. Abstract ............................................................................................................. 171 9.2. Larticle .................................................................................................................... 172 9.2.1. Article ............................................................................................................... 173 9.2.2. Acknowledgements ........................................................................................... 176 9.2.3. Tables ................................................................................................................ 177 10. La discussion........................................................................................................... 181 10.1. La gestion des donnes de transcriptomique ......................................................... 181 10.2. La transcriptomique : limites et russites .............................................................. 184 10.3. Le gnome de Leishmania tarentolae .................................................................... 187 10.4. Les particularits du gnome de Leishmania tarentolae ....................................... 191 10.5. Le diagnostic des infections respiratoires virales .................................................. 195 10.6. Lamlioration dun test diagnostique ................................................................... 198 11. Conclusion .............................................................................................................. 201 Bibliographie ...................................................................................................................... 204 Annexe 1. Liste des tudes utilisant la biopuce Leishmania .............................................. 232 Annexe 2. Programme Perl pour la cration de fichiers SpotType .................................... 234 Annexe 3. Protocole danalyse R de la biopuce Leishmania de premire gnration ........ 237 Annexe 4. Protocole danalyse R de la biopuce Leishmania de seconde gnration ......... 243

Liste des tableauxTable 5.1. Summary of sequenced Leishmania spp. genomes. .................................... 95 Table 5.2. Description of Leishmania tarentolae sequencing runs with statistics. ...... 96 Table 5.3. Sequence of primers used to amplify probes for southern blot hybridizations. ............................................................................................. 97 Table 5.4. Genes in orthologous groups with lower copy number in Leishmania tarentolae compared to the pathogenic Leishmania species. ...................... 98 Table 5.5. Genes in orthologous groups with higher copy number in Leishmania tarentolae compared to the pathogenic Leishmania species. .................... 100 Table 5.6. Orthologous groups of genes absent from Leishmania tarentolae, sorted by distribution between the pathogenic species. ............................. 104 Table 5.7. Orthologous groups of genes found in Leishmania tarentolae but not in the other sequenced Leishmania............................................................ 112 Table 5.8. Association of Leishmania tarentolae orthologous groups of genes with differential expression in promastigote and/or amastigote life stages in pathogenic Leishmania species. ................................................. 116 Table 7.1. Viruses to be detected using the respiratory virus assay, including results from published prevalence studies. ................................................ 147 Table 7.2. Summary of the primer sets included in the respiratory virus assay. ........ 148 Table 8.1. Sequence for primers and probes for the qRT-PCR assay. ....................... 163 Table 8.2. Sensitivities of the qRT-PCR assay and of the microarray assay for each virus. .................................................................................................. 165 Table 8.3. Specimens tested in the analytical specificity study. ................................. 166 Table 8.4. Sample positivity by qRT-PCR and microarray for each virus (n = 221). ................................................................................................... 167 Table 8.5. Comparison of qRT-PCR and microarray results for 221 specimens. ...... 168 Table 8.6. Discordant specimens between the qRT-PCR and the microarray assay with signals, internal controls and validation results. ...................... 169 Table 9.1. Cross-reactivity and inclusivity study results for Influenza A and S-OIV detection in clinical samples of various respiratory viruses and reference strains of influenza viruses or bacteria. ..................................... 177 Table 9.2. Contingency table for S-OIV detection using the AutoGenomics RVP Plus assay compared to results obtained from the reference laboratory.... 179 Table 9.3. Specimens positive for different viruses including S-OIV using the AutoGenomics RVP Plus assay. ................................................................ 180

Liste des figuresFigure 4.1. Captures dcran du logiciel LMMAP pour une exprience fictive de biopuce. (A) Prsentation gnrale dun projet dans LMMAP. (B) Les tapes dune exprience de biopuce dans LMMAP. .......................................................................................... 71 Figure 5.1. Synteny map of L. tarentolae (middle) compared to L. major (top) and L. infantum (bottom). Genes are grey on chromosome tracks. L. tarentolae contig delimitation is in black in the middle lane. Shade of synteny blocks is proportional to sequence identity, the darker the more similar are the sequences. The scale represents nucleotide position on the chromosome. (A) 5' region of chromosome 28. (B) 5' region of chromosome 7. (C) 3' end of chromosome 35. ..... 117 Figure 5.2. Differential distribution of genes and orthologous groups of genes between L. tarentolae and L. major. aGene counts referring to L. major. bGene counts referring to L. tarentolae. Lists include the description of orthologous groups (OG) of genes that have differential distribution between L. tarentolae and the three sequenced Leishmania pathogenic species. Counts of genes within the different OG are in parenthesis. The complete list of genes and orthologous group for selected categories is shown in Tables 5.4, 5.5, 5.6 and 5.7. *Genes with the highest copy number variability in L. tarentolae. ............ 118 Figure 5.3. Differential distribution of genes involved in lipophosphoglycan and phosphoglycan modification in L. tarentolae (middle) as compared to L. major (top) and L. infantum (bottom). Phosphoglycan beta 1,2 arabinosyltransferase are shaded with crosses. A first group of phosphoglycan beta 1,3 galactosyltransferase are shaded with thin lines, and a second group with bold lines. Other genes are grey on chromosome tracks. L. tarentolae contig delimitation is in black in the middle lane. Shade of synteny blocks is proportional to sequence identity, the darker the more similar are the sequences. The scale represents nucleotide position on chromosome 2. ............................................................................... 120 Figure 5.4. Analysis of amastin-coding genes in pathogenic and nonpathogenic Leishmania spp. (A) Phylogenetic tree of the amastin genes in L. tarentolae, L. major, L. infantum and L. braziliensis. Labels refer to amastin subfamilies. L. tarentolae amastins are in bold. The evolutionary history was inferred using the Neighbor-Joining method, with a bootstrap test of 500 replicates. Phylogenetic analyses were conducted in MEGA4 (215). (B) Synteny of L. major (top), L. tarentolae (middle) and L. infantum (bottom) amastin/tuzin cluster located on chromosome 8. Amastins are marked with

xii the letter A and tuzins with the letter T. (C) Synteny of L. major (top), L. tarentolae (middle) and L. infantum (bottom) amastin/tuzin cluster located on chromosome 34. .......................... 121 Density of read coverage for genes present in high copy number in L. tarentolae. For each position of the reference L. major genes, the number of corresponding reads were counted and plotted on the graph. Protein domains are indicated on the upper portion of each graph. (A) Leishmanolysin (GP63) gene; LmjF10.0480 is used as a reference. (B) Promastigote surface antigen PSA31C gene; LmjF31.1440 is used as a reference. ..................................................................... 123 Protease activity of GP63 in six Leishmania species. (A) Western blot using monoclonal antibody targetting GP63 show the quantity of this protease in each sample. (B) Gelatin zymography assay determining the protease activity of GP63. No signal was observed for L. tarentolae, suggesting the absence of GP63 activity in this species. Lane 1. L. mexicana; 2. L. major; 3. L. d. donovani; 4. L. d. infantum; 5. L. amazonensis; 6. L. tarentolae. .................................................................. 124 Southern blot hybridization of genes that are present in variable copy number between L. tarentolae and the other pathogenic species. Total genomic DNA of isolates was digested with XhoI, run on agarose gels, blotted and hybridized with a combination of PCR-specific probes derived from each species (see Table 5.3 for primer sequences and probe details): (A) Amastin delta. (B) Amastin proto-delta (shared by the four species) as a control. (C) Phosphoglycan beta 1,3 galactosyltransferase. (D) Phosphoglycan beta 1,2 arabinosyltransferase. (E) Leishmanolysin (GP63). (F) Surface antigen protein PSA31C. Lanes 1, L. tarentolae Parrott-TarII; 2, L. tarentolae S125; 3, L. major Friedlin; 4, L. infantum JPCM5; 5, L. braziliensis WHOM/BR/75/M2904. ........................ 125 Flowchart comparing the protocols for the real-time PCR assay and for the microarray assay. RNA extraction and reverse transcription steps are common to both methods. Real-time PCR assay has only one setup step compared to the microarray assay, which has three. However, the time required to perform the real-time PCR assay multiplied for each four samples to test. The time required for the automated microarray assay is multiplied for each 24 samples. Overall, the qRT-PCR assay requires 60 min of setup time and a total of 120 min of reaction time for 4 specimens, while the microarray assay requires 60 minutes of setup time and 17 hours of reaction time for 24 specimens. ................................................................................. 170

Figure 5.5.

Figure 5.6.

Figure 5.7.

Figure 8.1.

1. IntroductionLavnement de la gnomique et du squenage haut dbit a engendr une nouvelle re dans ltude de la biologie. Aujourdhui, la seule squence dun gnome permet de raliser une multitude danalyses qui, en elles-mmes, apportent beaucoup la biologie de lorganisme tudi. Des problmes de biologie qui demandaient un travail colossal peuvent maintenant tre rsolus en quelques expriences, parfois mme sans travail de laboratoire. Ce changement de paradigme ncessite une nouvelle approche la biologie, car les questions scientifiques ne se posent plus de la mme manire. Dun point de vue fondamental, la gnomique et la bio-informatique permettent une tude plus intgre des organismes vivants. Dun point de vue appliqu, les technologies de la gnomique peuvent tre adaptes au diagnostic des maladies infectieuses, permettant ainsi une meilleure comprhension et une meilleure gestion de ces maladies. Ces deux aspects ont t explors au cours de mon doctorat. Ainsi, cette thse sera spare en deux sections distinctes avec, pour fil conducteur, la squence des gnomes et leur tude par la bioinformatique. Dans la premire partie de cette thse, soit les chapitres de 2 5, je prsenterai comment la gnomique, supporte par la bio-informatique, a permis de mieux comprendre le parasite protozoaire Leishmania. Ainsi, ltude de ce parasite est la source de questions partir desquelles des approches gnomiques et bio-informatiques ont t tablies. Avant de passer aux diffrentes ralisations faites au cours de mon doctorat (chapitres 4 et 5), je prsenterai un rsum de ce qui est connu du parasite Leishmania (chapitre 2) ainsi quun survol des technologies de gnomique utilises dans cette thse, comme le squenage de gnomes et lanalyse de lexpression des gnes (chapitre 3). Au chapitre 4, je dcrirai limplantation dun systme de gestion et danalyses de donnes tires dtudes dexpression gnique par biopuces. La mise en place de ce systme sera traite des points de vue de la bio-informatique et de lanalyse des donnes. Je prsenterai aussi, dans cette section, les rsultats publis dans des tudes utilisant ces systmes. Je

2 discuterai des avantages et des inconvnients de cette approche en mappuyant sur diffrentes publications pour lesquelles jai ralis les analyses bio-informatiques. Au chapitre 5, je prsenterai le squenage du gnome du parasite Leishmania (sauroleishmania) tarentolae et je comparerai cette squence avec celle des gnomes de Leishmania dj squencs, soit ceux de L. braziliensis, de L. infantum et de L. major. Dans cette section, je dcrirai les caractres gnomiques qui diffrencient une espce de Leishmania non pathogne pour lhumain despces pathognes. Je montrerai aussi comment il est possible dintgrer les donnes exprimentales de gnomique haut dbit pour mieux comprendre des organismes dont le gnome est peu connu ou peu annot. Lensemble de ces analyses permet une meilleure comprhension du parasite et procure des donnes qui savreront utiles dans la cration de nouveaux outils pour lutter contre la leishmaniose. Dans la deuxime partie de cette thse, je montrerai comment les technologies de la gnomique peuvent tre mises au service du diagnostic des maladies infectieuses, en particulier des infections respiratoires. Au chapitre 6, je prsenterai un aperu des infections respiratoires virales ainsi que des mthodes de diagnostic. Au chapitre 7, jexpliquerai les rudiments de la conception dun test de diagnostic molculaire. Au chapitre 8, je prsenterai un test de diagnostic molculaire des virus respiratoires sur biopuce qui a t adapt un appareil de diagnostic automatis conu pour les laboratoires cliniques. Ensuite, au chapitre 9, je dcrirai comment ce test diagnostique a t modifi pour permettre la dtection de la grippe A (H1N1) dorigine porcine. Toutes ces ralisations dmontrent la puissance de la gnomique et de la bio-informatique, qui permettent des avances scientifiques et techniques utiles dans des domaines qui, par le pass, taient exclusifs. Elles montrent aussi comment il est important de repenser les problmes biologiques afin dinnover. Ces techniques permettent aussi de poser de nouvelles questions.

3

ObjectifsLobjectif gnral de mes travaux de doctorat tait dutiliser la bio-informatique afin de favoriser lavancement des connaissances dans plusieurs domaines de ltude des maladies infectieuses. Des objectifs particuliers ont t tablis pour chacun des projets dcrits dans cette thse. Ltude du parasite Leishmania avait pour objectif gnral de mieux comprendre le gnome de ce parasite par le biais de la gnomique et de la bio-informatique. Les objectifs particuliers taient les suivants : Favoriser les tudes de transcriptomique et de gnomique comparative par hybridation sur biopuce en crant un cahier de laboratoire lectronique et des protocoles danalyse de biopuces; Squencer le gnome de Leishmania (sauroleishmania) tarentolae, lannoter et le comparer aux espces de Leishmania pathognes pour lhumain afin de mieux comprendre : o le mode de vie dun parasite de lzard, o la virulence des espces pathognes pour lhumain en dterminant quels gnes de L. major, de L. infantum et de L. braziliensis sont absents ou en moins grand nombre de copies chez L. tarentolae. Ltude des virus respiratoires avait pour objectif gnral de fournir des outils aux cliniciens et aux pidmiologistes pour quils puissent mieux valuer limportance des diffrents virus respiratoires observs en clinique. Les objectifs particuliers de ce projet taient de crer un outil diagnostic permettant lidentification des virus respiratoires les plus communs en un seul test automatis, valider ce test avec des chantillons de laboratoire et des chantillons cliniques,

4 dtudier la distribution des virus respiratoires infectant les enfants en effectuant une tude clinique rtrospective.

5

2. Le parasite LeishmaniaLOrganisation mondiale de la sant (OMS) a inclus la leishmaniose dans sa liste de priorit des maladies combattre. Cela nest pas surprenant, car, mme si la maladie est peu connue du public nord-amricain, elle touche 88 pays et met en jeu la sant de plus de 350 millions dindividus (1). Environ 14 millions de personnes souffrent de cette maladie et plus de 2 millions de nouveaux cas sont dclars chaque anne.

2.1. La rpartition territoriale de la leishmanioseDun point de vue historique, la maladie assaille les habitants de certaines rgions depuis plus de 4 millnaires, puisque des traces de leishmanioses viscrale et cutane1 ont t observes chez des momies gyptiennes datant denviron 2000 av. J.-C. (2). Depuis quelques annes, la co-infection par le virus dimmunodficience humaine (VIH) et par Leishmania est en mergence, causant de graves problmes chez les malades immunosupprims (3). Le parasite Leishmania peut aussi infecter des animaux, par exemple le chien, ce qui fait de la leishmaniose une zoonose. Le parasite Leishmania est endmique aux rgions quatoriales du globe, notamment en Amrique centrale, en Amrique du Sud, en Afrique, au sud de lEurope et au MoyenOrient (en particulier dans le bassin mditerranen) et en Asie. Selon lOMS, plus de 90 % des 500 000 cas annuels de leishmaniose viscrale se situent au Bangladesh, au Brsil, en Inde, au Npal et au Soudan (1). Plus de 50 000 de ces derniers sont mortels. Parmi les 1 500 000 cas de leishmaniose cutane rpertoris annuellement, plus de 90 % se retrouvent en Afghanistan, en Algrie, en Arabie saoudite, au Brsil, au Prou, en Rpublique islamique dIran et au Soudan. Aussi, vu la situation politique mondiale et limplication du Canada et des tats-Unis en Afghanistan et en Iraq, la maladie reprsente une menace pour de nombreux soldats nord-amricains (4). Depuis quelques annes, des cas de leishmaniose ont t diagnostiqus dans des rgions qui ntaient habituellement pas touches, ou trs peu, par cette maladie, comme le nord de lItalie (5) et le sud de lAllemagne (6). Les changements climatiques observs au cours des1

Voir la section 2.2 pour les dfinitions des types de leishmaniose.

6 dernires annes pourraient tre responsables dune telle modification de la distribution de la maladie. En effet, ils permettent une meilleure survie des vecteurs de la maladie, les moustiques, dans des rgions o ils ne pouvaient pas, dans le pass, rsister lhiver (7). Une modification de la distribution gographique des espces de Leishmania peut aussi tre influence par la migration de certaines espces animales servant de rservoir la maladie, par exemple le chien, qui peut aussi tre infect par le parasite (8).

2.2. Les types de leishmanioseIl existe plusieurs types de leishmaniose, entre autres types les leishmanioses cutane, viscrale et mucocutane. La pathologie est associe lespce de parasite infectant lindividu, mais certaines espces peuvent causer diffrentes formes de leishmanioses, ce qui dpend probablement aussi de la rponse immunitaire de lhte (6, 9). La leishmaniose cutane est dfinie par le dveloppement dulcres de la peau. Linfection peut prendre plusieurs mois gurir et dfigure parfois le patient. La leishmaniose cutane est surtout cause par L. major, par L. tropica et par L. aethiopica dans les vieux continents et par L. mexicana, par L. amazonensis et par L. braziliensis en Amrique. La leishmaniose viscrale, aussi appele kala-azar ou fivre noire , est caractrise par de la fivre, des pertes de poids, des dsordres chroniques des fonctions hmatologiques et hpatosplniques, cest--dire des dsordres relatifs au sang, au foie et la rate. Cette leishmaniose est mortelle si elle nest pas traite et elle est cause notamment par L. infantum et par L. donovani. L. donovani cause aussi la leishmaniose post-kala-azar (PKDL), une forme secondaire de leishmaniose qui se caractrise par lapparition de lsions sur le visage suivie de la dissmination de ces dernires sur tout le corps. La leishmaniose mucocutane, finalement, est une forme intermdiaire de leishmaniose pouvant entraner la destruction des muqueuses du nez, de la bouche et de la trache, dfigurant ainsi le patient. Cette forme de leishmaniose est cause par L. braziliensis.

7

2.3. Le parasite LeishmaniaLeishmania est un parasite protozoaire de lordre des Kinetoplastidae et de la famille des Tripanosomatidae. La diversit des espces de Leishmania reflte bien la diversit des formes cliniques de la maladie (9-11). Il a t confirm quune vingtaine despces de Leishmania peuvent infecter lhumain. Les Leishmania ont deux types de classification : selon le sous-genre et selon la gographie. Sous-genre : Leishmania (leishmania), Leishmania (vianna), Leishmania (sauroleishmania). Gographie : Leishmania du Nouveau Monde (New World), si le parasite est retrouv en Amrique. Son vecteur est la mouche des sables du genre Lutzomyia, Leishmania des Vieux Continents (Old World), si le parasite est retrouv en Europe, en Afrique ou en Asie. Il est transmis par la mouche du genre Phlebotomus. Le parasite Leishmania a un cycle de vie dimorphique (6, 10). Leishmania vit sous sa forme flagelle, aussi appele promastigote , dans le tractus digestif de la mouche des sables, son vecteur. Les parasites sont transmis par une piqre au cours du repas sanguin de linsecte. Au moment de son injection, le parasite est sous la forme promastigote et il sera phagocyt par le macrophage. Une fois dans le macrophage, le parasite se diffrencie en amastigote, forme capable de survivre dans les conditions extrmes du phagolysosome des macrophages. Linfection par Leishmania dbute au site de la piqre pour ensuite progresser en diverses pathologies selon lespce infectante et la raction de lhte. Dans la

8 forme cutane de la leishmaniose, les macrophages infects restent confins aux lsions de la peau alors que, dans la forme viscrale, les sites majeurs dinfections sont le foie, la rate et la moelle pinire (10). Cependant, les macrophages infects doivent aussi tre prsents sous la peau afin de favoriser la retransmission du parasite par le vecteur (12). Le cycle de Leishmania sera discut plus en dtail dans la section 2.5.

2.3.1. Les Leishmania (leishmania)Le sous-genre Leishmania (leishmania) a t retrouv en Amrique et dans les Vieux Continents (13). Le complexe L. donovani inclut L. donovani et L. archibaldi. Le complexe L. infantum inclut L. infantum et L. chagasi. Les complexes L. tropica, L. killicki, L. aethiotropica, L. major et L. mexicana comprennent uniquement les espces ponymes. Le complexe L. amazonensis inclut les espces L. amazonensis et L. aristidesi. Tous ces complexes sont retrouvs dans les Vieux Continents, lexception des complexes L. mexicana et L. amazonensis, qui sont retrouvs en Amrique. Les espces L. infantum, L. tropica, L. killicki et L. major sont endmiques au bassin mditerranen. L. major, L. tropica et L. killicki causent une leishmaniose cutane, aussi nomme oriental sore . L. mexicana et L. amazonensis causent aussi une leishmaniose cutane. L. aethiotropica cause aussi une leishmaniose cutane, qui peut tre diffuse. L. donovani et L. infantum causent une leishmaniose viscrale, aussi appele kala-azar ou fivre noire .

2.3.2. Les Leishmania (vianna)Le sous-genre Leishmania (vianna) est endmique en Amrique. Le complexe L. braziliensis inclut L. braziliensis et L. peruviana. Le complexe L. guyanensis inclut L. guyanensis, L. panamensis et L. shawi. Les complexes L. naiffi et L. lainsoni incluent uniquement les espces ponymes. lexception de L. braziliensis, qui peut aussi causer une leishmaniose mucocutane, ces espces causent une leishmaniose cutane. Quant L. guyanensis, il peut causer une forme systmique et diffuse de la maladie (13). De fait, la forme viscrale est rare en Amrique (14).

9

2.3.3. Les Leishmania (sauroleishmania)Leishmania tarentolae est le parasite le plus tudi des Leishmania (sauroleishmania). Il a t isol des lzards Tarentola mauritanica et de T. annularis (15). Pendant un certain temps, son appartenance au genre Leishmania a t mise en doute, mais cela a t infirm et lespce est maintenant confirme comme un membre des leishmanies (16, 17). Lespce est rpandue au Moyen-Orient. Dailleurs, une tude qui devait valuer la proportion de phlbotomes positifs pour Leishmania a t ralise dans une base militaire en Iraq. Cette tude a identifi 91,9 % de 284 phlbotomes positifs pour L. tarentolae (4). Il a t rapport que, chez le lzard, L. tarentolae causait une faible parasitmie, denviron un leucocyte infect par champ de microscope 40X, et que ces leucocytes contenaient de 3 9 amastigotes intracellulaires (15). Une autre tude dobservation de lzards, cette fois au Turkmnistan, a rapport une faible parasitmie chez le lzard, mais aucune Leishmania sous forme amastigote (18). Il a t montr que L. tarentolae pouvait tre phagocyt par des macrophages humains ou murins et quils pouvaient sy diffrencier en amastigotes. La mme tude a montr que L. tarentolae pouvait activer la maturation des cellules dendritiques, induire la prolifration des cellules T et la production dinterfrons gamma, et induire une rponse immune de type Th1 (cellulaire) (19). L. tarentolae est rapidement limin par le systme immunitaire humain ou murin (18). Comme le parasite nest pas dangereux pour lhumain et quil entrane une protection immunitaire croise avec L. donovani chez la souris, il est considr comme un candidat vaccinal potentiel (19). L. tarentolae a aussi t considr comme un vecteur intressant pour la vaccination contre le virus dimmunodficience humaine (20).

2.3.4. Les autres espces de trypanosomatidesTout comme Leishmania, les parasites du genre Trypanosoma appartiennent lordre de Kinetoplastidae. Les deux principaux pathognes de ce genre sont Trypanosoma brucei et T. cruzi. Il existe aussi plusieurs espces de trypanosomes non pathognes pour lhumain, mais qui sattaquent dautres mammifres ou des reptiles. T. brucei est responsable de la maladie du sommeil, aussi appele trypanosomiase africaine humaine . Cette maladie cause environ un demi-million de cas par anne et

10 environ 70 000 morts au centre de lAfrique (21). La maladie du sommeil cause par T. brucei est fatale si elle nest pas traite. T. brucei est transmis par la piqre de la mouche ts-ts. Le parasite survit dans le sang du mammifre qui lui sert dhte. mesure que linfection se diffuse, le parasite modifie ses protines de surface afin dviter son limination par le systme immunitaire. Finalement, quand linfection est bien tablie, le parasite passe de sa forme flagelle une forme non flagelle qui se divise moins rapidement. Cette transformation prolonge la vie de lhte et favorise la transmission du parasite. T. brucei gambiese cause une maladie chronique louest de lAfrique subsaharienne, T. brucei rhodesiense cause une maladie aigu lest et au sud de cette mme rgion et, finalement, T. brucei brucei nest pas pathogne pour lhumain (22). Le parasite Trypanosoma cruzi, qui cause la maladie de Chagas, est retrouv en Amrique du Sud (22). Environ 10 millions dindividus sont infects par T. cruzi. Le parasite est transmis par la dfcation du vecteur pendant son repas sanguin et par la contamination subsquente de la plaie par les fces. Les trypomastigotes mtacycliques transmis par le vecteur pntrent ensuite diffrents types de cellules, notamment les cellules du cur, et se transforment en amastigotes. Les amastigotes se transforment ensuite en trypomastigotes et font exploser les cellules, ce qui permet leur libration dans le sang et la contamination de nouvelles cellules et de nouveaux vecteurs. Les parasites prennent la forme dpimastigotes dans lintestin moyen (mid-gut) des vecteurs (22). Le taxon T. cruzi se divise en deux groupes, T. cruzi I et T. cruzi II. son tour, le second groupe peut tre spar en cinq sousgroupes (de T. cruzi IIa T. cruzi IIe). Le groupe I sattaque aux marsupiaux alors que le groupe II sattaque aux mammifres (23).

2.4. Les antiparasitaires et la rsistanceLarsenal thrapeutique pour lutter contre Leishmania est limit. Mme si plusieurs antiparasitaires sont offerts pour contrer la leishmaniose, la rsistance du parasite ces mdicaments est frquente (24). Le mdicament classique pour lutter contre la maladie est lantimoine, utilis depuis plus de 70 ans (25). Cependant, certaines rgions montrent un taux de rsistance lev et quasi universel. Cest le cas de lInde (26). Les mdicaments de seconde ligne sont la pentamidine et lamphothricine B. Les antifolates comme le mthotrexate ont beaucoup t tudis en laboratoire, mais ils nont pas t utiliss sur le

11 terrain. La miltfosine, rcemment introduite sur le march, est en phase III dessais cliniques. Il sagit du premier traitement oral de la leishmaniose (27). Lantimoine est principalement offert sous deux formes : le stibogluconate de sodium et lantimoniate de mglumine, commercialis sous le nom de Glucantime. Ces mdicaments contiennent de lantimoine sous sa forme pentavalente, le Sb(V). Afin dtre actif, lantimoine doit tre rduit sous sa forme trivalente, le Sb(III). Un doute subsiste savoir si la rduction de lantimoine est faite exclusivement dans le macrophage ou encore dans le parasite (28). Cependant, il a t montr que Leishmania possdait une enzyme capable de rduire le Sb[V] (29). Une fois lintrieur du parasite, lantimoine trivalent a un effet sur le mtabolisme du glutathion et du trypanothion. Il a t montr que le Sb(III) inhibait in vitro la trypanothione rductase (30) et la glutathione synthtase (31). La prsence de Sb(III) dans la cellule entrane aussi un efflux du trypanothion et du glutathion (32). Dans tous les cas, cela diminue le potentiel doxydorduction du parasite, ce qui entrane sa mort (33). Plusieurs modes de rsistance lantimoine sont connus et peuvent agir sur le mdicament de diffrentes faons : Blocage de lentre de lantimoine par la diminution du nombre de transporteurs la surface de la cellule ou par la mutation de ces derniers (33); Perte dactivit rductase du parasite qui entrane une diminution de la rduction du Sb(V) en Sb(III) (33); Augmentation du niveau de trypanothion par lamplification de lenzyme glutathione synthtase (GSH1) (34) ou la surexpression de lornithine dcarboxylase (ODC) (35); Augmentation de lefflux du mdicament par des transporteurs comme MRPA (Multidrug resistance protein A, anciennement p-glycoprotine A ou PGPA) ou dautres pompes defflux. La PGPA est un transporteur ABC intracellulaire qui entrane laccumulation des conjugus dantimoine dans des vacuoles intracellulaires (36).

12 La combinaison de plusieurs de ces modes de rsistance est parfois ncessaire au parasite pour survivre lantimoine. Par exemple, lamplification seule de la GSH1 nest pas suffisante et requiert aussi laugmentation de la quantit de transporteurs ABC (34, 35). Lamphothricine B est le traitement de seconde ligne contre la leishmaniose. Cet antiparasitaire agit sur lergostrol, qui compose la majeure partie de la membrane de plusieurs espces deucaryotes unicellulaires, dont Leishmania, T. cruzi et certains champignons. Leffet de ce mdicament peut varier dune espce lautre selon la proportion dergostrol composant leur membrane. Mme si la rsistance lamphothricine B na pas t observe frquemment, quelques mcanismes de rsistance ont t dcrits, incluant la modification de la structure des lipides membranaires par lutilisation dun prcurseur de lergostrol dans la construction des membranes ou par la modification de leur mthylation par inactivation dun gne (37). Finalement, des amplifications gniques causant la rsistance ont t observes chez L. tarentolae (38). Depuis le dbut des annes 2000, la miltfosine est utilise pour traiter la leishmaniose. Il sagit dun analogue des phospholipides. Les diffrentes espces de Leishmania ont des sensibilits diffrentes cet antiparasitaire, L. donovani tant la plus sensible (39). Dun autre ct, L. braziliensis et L. guyanensis ne semblent pas sensibles la miltfosine. La rsistance cet antiparasitaire est principalement cause par une diminution de laccumulation de la molcule dans la cellule (40). Ainsi, des mutations ponctuelles dans des transporteurs diminuent lentre dans la cellule. Laugmentation de la quantit de certains transporteurs ABC, permettant un meilleur efflux du mdicament, a t dcrite (41). Mme si la pentamidine a t longuement utilise comme mdicament de seconde ligne, son utilisation actuelle se rsume au traitement de la leishmaniose cutane, car le traitement de la leishmaniose viscrale semble induire une rsistance assez rapide contre ce mdicament. Le mode daction de cet antiparasitaire est peu connu, mais il inclut probablement une inhibition de la synthse des polyamines, une liaison au petit sillon de lADN et une modification du potentiel doxydorduction de la mitochondrie (42). Les modes de rsistance observs sont surtout une diminution de lentre de la molcule et une

13 augmentation de son efflux (43). Laccumulation de pentamidine dans la mitochondrie a t dcrite chez des cellules rsistantes et elle semblait diminuer lefflux de la molcule (44). Les antifolates ont t utiliss pour lutter efficacement contre plusieurs maladies, notamment contre les parasites des genres Toxoplasma et Plasmodium. Cependant, comme Leishmania est auxotrophe aux folates, cest--dire quil ne les synthtise pas de novo, ces mdicaments ne sont pas utiles contre ce parasite. Malgr cela, plusieurs groupes ont tudi leffet des antifolates sur Leishmania, ce qui a permis de mieux connatre les enzymes participant la rcupration dans le milieu de ces molcules essentielles la survie du parasite (45). Le mthotrexate (MTX) est un mdicament modle utilis contre Leishmania. Le principal mode de rsistance contre ce mdicament est lamplification gnique de la rgion H, qui contient, spcialement, des transporteurs de molcules et la ptridine rductase (PTR1). Aussi, des transporteurs comme BT1 (biopterin transporter 1), qui sont plus efficaces pour le transport des folates que pour le transport du MTX, peuvent mener la rsistance dans un milieu riche en folates (46).

2.5. Le cycle de vie et linfectionLe parasite Leishmania vit sous trois formes successives qui lui permettent de survivre dans des conditions diffrentes. Chacune de ces formes a une fonction propre. La forme promastigote procyclique est adapte lpithlium du tractus digestif de la mouche des sables. Cette forme nest pas infectieuse, mais elle a la capacit de se diviser. La forme promastigote mtacyclique est infectieuse, mais incapable de se diviser. La mtacyclognse prpare le parasite linvasion de lhte vertbr et transforme le promastigote en sa forme mtacyclique, qui lui permet de rsister aux dfenses de lorganisme et dinfecter le macrophage. La forme amastigote permet au parasite de survivre dans le phagolysosome des cellules infectes, notamment le macrophage. La forme amastigote est infectieuse et peut se diviser.

14 Le passage entre ces formes requiert la production de nombreuses protines membranaires ainsi que des changements dans le mtabolisme du parasite. Selon les stades de vie de Leishmania, diffrentes molcules favorisent la survie et linfectivit du parasite. Les gnes dintrt impliqus dans la virulence peuvent tre classs en deux catgories : les dterminants invasifs/vasifs et les dterminants de la pathogense (6). Les dterminants invasifs/vasifs sont ncessaires linfection, mais ils nont pas dimpact sur la forme de la maladie. Ils incluent les molcules qui permettent ladhsion de Leishmania au macrophage, lentre du parasite dans le macrophage, la survie de Leishmania lintrieur du macrophage et la diffrenciation des stades du parasite. De leur ct, les dterminants de la pathogense ont un impact direct sur la forme clinique de la maladie et sur sa svrit. Plusieurs tudes visent dcouvrir quels sont les gnes impliqus dans chacun de ces processus.

2.5.1. Lenvironnement et la diffrenciation du parasiteLes deux environnements extrmes que visite Leishmania au cours de son cycle de vie sont le tractus digestif de son vecteur, la mouche des sables, et le phagolysosome de sa cellule hte, le macrophage. Plusieurs conditions sont modifies entre ces deux environnements et la survie du parasite ncessite une adaptation rapide des environnements extrmes. Le changement drastique de temprature au moment de la piqre, passant de la temprature environnante celle de lhte humain, environ 37 C, et la variation majeure du pH, qui passe dun pH neutre un pH acide autour de 5,5, constituent un signal qui peut tre simul in vitro afin dinduire la diffrenciation des promastigotes en amastigotes dits axniques (47). La quantit de glucose disponible varie aussi beaucoup entre ces deux environnements, car cette dernire est beaucoup plus leve dans le tractus digestif du vecteur que dans le phagolysosome du macrophage. Cependant, la quantit dacides amins disponibles est plus leve dans le phagolysosome (48). Plusieurs changements dans le mtabolisme de Leishmania au cours de son passage du stade promastigote au stade amastigote ont t dcrits dans la littrature (48). Entre autres modifications, il semble y avoir une diminution de la glycolyse, qui serait compense par une augmentation de plusieurs processus tels la gluconogense, la -oxydation, le

15 catabolisme des acides amins, le cycle des acides tricarboxyliques, la chane respiratoire mitochondriale et les capacits de phosphorylation oxydative (48). Ainsi, le parasite utilisera le glycrol et les acides amins prsents dans le milieu pour pallier son manque de glucose. Les lments les plus tudis de la diffrenciation du parasite sont les molcules sa surface. De nombreuses protines de Leishmania sont associes des fonctions dinteraction avec son environnement et peuvent tre dcrites comme des protines similaires aux adhsines (adhesin-like proteins ou ALP). Ce groupe inclut plusieurs protines, comme lamastine, la protase de surface GP63, lantigne de surface promastigote PSA2 (aussi connu sous le nom de GP46), les protines de surface hydrophyles actyles (hydrophilic acetylated surface proteins ou HASP) et les protophosphoglycanes (PPG) (49). Le glycolipide le plus abondant la surface de la cellule est le lipophosphoglycane (LPG) (50). En effet, la glycocalyx de Leishmania peut contenir au-del de 5 millions de molcules de LPG. Cependant, sa quantit et sa composition varient selon les stades de dveloppement du parasite et selon les espces de Leishmania. Ainsi, au cours du passage la forme mtacyclique, les LPG des promastigotes doublent leur longueur en passant de 15 30 units rptitives de sucres. Cette modification aide le parasite rsister aux mcanismes de dfense de lhte, notamment en bloquant laction lytique du complment. De plus, dans la mouche des sables, les LPG sont responsables de lattachement et du dtachement du parasite lpithlium intestinal du vecteur. Une fois dans le macrophage, la quantit de LPG diminue dun facteur trois. Pour certaines espces de Leishmania, par exemple L. major et L. donovani, le LPG est essentiel linfection alors que pour dautres espces, comme L. mexicana, il nest pas essentiel (51). Dautres phospholipides sont aussi importants pour le parasite, comme les protophosphoglycanes (PPG) et les glycosylinositolphospholipides (GIPL). Ces derniers sont prsents la fois chez le promastigote et chez lamastigote (50). La protine GP63, aussi appele leishmanolysine , est une ectomtalloprotase qui est beaucoup plus abondante chez le promastigote que chez lamastigote. Elle pourrait jouer un rle dans la rsistance la lyse humorale, dans lattachement des parasites au macrophage

16 ou dans leur phagocytose (52, 53). Cette famille de gnes, prsente sous forme de rptitions en tandem, est hautement polymorphique, mme lintrieur dune mme espce (6). Rcemment, Gomez et ses collaborateurs ont montr que GP63 joue un rle dans lactivation de la protine tyrosine phosphatase SHP-1 du macrophage. En effet, la protine GP63 induit une cascade de signalisation permettant une rduction de linflammation et de la rponse microbicide du macrophage (54). Lamastine est une protine abondante principalement exprime chez lamastigote. Comme GP63, cette protine est prsente en rptitions en tandem dans le gnome et elle est aussi fortement polymorphique. Il existe en 3' de lamastine une rgion rgulatrice non codante conserve qui module son expression (55). Aussi, dans certaines rgions du gnome, lamastine est trouve en tandem avec la tuzine. La fonction de ces deux protines reste indtermine jusqu prsent. En ce qui concerne les protines ayant un impact sur la virulence du parasite, la protine A2 est souvent cite comme tant en partie responsable du tropisme de certaines espces de Leishmania pour la forme viscrale (56, 57). Exprime chez L. donovani et L. infantum, A2 nest pas fonctionnelle chez L. major. Des tudes ont montr que la disparition de cette protine chez L. donovani entrane une diminution de la survie du parasite dans les viscres (58). Comme aucune fonction nest associe aux deux tiers des gnes de Leishmania, plusieurs facteurs de virulence ou protines impliques dans linfection nont pas encore t identifis ou dcrits. Dans cette optique, plusieurs tudes ont cribl le gnome de L. major afin dy trouver des gnes qui pourraient tre associs des catgories fonctionnelles lies la virulence ou linfectivit. Ces protines ont une importance vitale pour Leishmania, car elles lui permettent de survivre dans son vecteur et dans son hte. Singh et ses collaborateurs ont cribl, avec des mthodes bio-informatiques, le gnome de L. major afin dy trouver des protines qui possdaient un domaine adhesin-like (ALP) (49). Parmi les 194 ALP potentielles, 120 avaient une ou plusieurs rgions transmembranaires ou un peptide signal et 56 avaient les deux. Finalement, 6 protines hypothtiques possdaient les trois lments, ce qui en faisait des ALP potentielles. Nanmoins, une fonction plus prcise na pas encore t associe ces ALP potentielles.

17 Zhang et ses collaborateurs ont utilis une approche avec un modle animal pour tenter dlucider la fonction de sept protines trouves chez L. infantum, mais absentes chez L. major (59). Ainsi, ils ont introduit ces sept protines, clones partir du gnome de L. donovani, dans L. major afin dobserver si elles causaient un changement de pathologie dans des souris BALB/c, en particulier si linfection viscrale par ces parasites tait augmente. Parmi les sept gnes tests, seulement un, Li1040, a augment la viscralisation de L. major et, trangement, le gne tait prsent chez cette espce. Leur tude suggre donc que la surexpression de Li1040 causerait ce changement de phnotype, cest--dire le passage de la forme cutane la forme viscrale. Cette protine est probablement implique dans le transport endosomal des protines.

2.5.2. Les Leishmania et la rponse immunitaireAfin dliminer linfection cause par nimporte quelle espce de Leishmania, un organisme doit produire une rponse immune de type cellulaire (Th1) (9, 10, 13). En effet, des expriences chez la souris ont montr quune rponse cellulaire limine linfection Leishmania tandis quune rponse humorale (Th2) permet au parasite de survivre (10). La rponse cellulaire entrane la production dinterleukine 2 (IL-2) et dinterfron (IFN- ).

LIFN- active les macrophages qui produiront lenzyme oxyde nitrique synthtase de type 2 (iNOS2), responsable de la formation doxyde nitrique (NO) (60). Cette rponse permet de limiter la croissance intracellulaire du parasite. De son ct, la rponse humorale entrane la production dinterleukine 4 (IL-4), dinterleukine 5 (IL-5) et dinterleukine 10 (IL-10), qui dsactivent les macrophages et entranent la croissance intracellulaire du parasite (10). Cependant, le contact entre le parasite et le macrophage semble empcher le macrophage de rpondre lIFN- (61). Une fois labri dans le phagolysosome de la cellule infecte, le parasite utilise plusieurs stratgies pour rduire la prsentation dantignes au systme immunitaire. Par exemple, L. donovani rprime lexpression du complexe majeur dhistocompatibilit de classe 2 (CMH-2) (61). La prsentation dantignes peut aussi tre rprime en interfrant avec le chargement des antignes dans le CMH-2. Lendocytose du CMH-2 suivie de sa dgradation par des protases a t observe chez L. amazonensis (61).

18 Ltude du transcriptome de cellules dendritiques et de macrophages infects par L. major ou par L. donovani a montr que, mme si chacun des parasites gnrait une surexpression de gnes impliqus dans la rponse inflammatoire, linfection par L. major produisait une raction inflammatoire plus forte que celle produite par L. donovani. Cette rponse inflammatoire accrue pourrait tre en partie responsable du confinement de L. major au site de linfection (62). Plusieurs molcules de Leishmania, impliques dans la virulence de linfection, pourraient avoir un impact sur la rponse immunitaire de lhte. Il sagit notamment de glycoprotines, comme les lipophosphoglycanes (LPG), ou de protases, comme la leishmanolysine (GP63) (63). Il a t montr que les LPG de L. donovani bloquent la migration transendothliale des monocytes et quils rduisent lexpression endothliale des protines E-slectine, ICAM-1 et VCAM-1 sans modifier la structure de la monocouche endothliale (64). Dun autre point de vue, les diffrences entre les LPG des espces de Leishmania pourraient jouer un rle dans la comptence dune espce tre transmise par diffrentes espces de mouches des sables (65). Plusieurs chimiokines, de petites protines solubles responsables du chimiotactisme des cellules immunitaires, sont impliques dans la rponse linfection. Cependant, ces chimiokines dpendent de lespce de Leishmania infectante (66). Dans le cas de linfection chronique de la souris par L. donovani, les cellules dendritiques murines deviennent dficientes quant leur migration et leur rponse aux chimiokines CCL21 et CCL19. Cette dficience serait cause par linhibition du rcepteur de chimiokines 7 (CCR7) par linterleukine 10 et par le facteur de ncrose tumorale alpha (tumor necrosis factor alpha ou TNF- . Cette interaction pourrait jouer un rle important dans la pathogense de la leishmaniose viscrale (67). Dans le cas de la leishmaniose cutane murine cause par L. major, les cytokines TNF- , IL-1B et MIP-1 (ou CCL3) rgulent le transport de L. major du site de linfection jusquaux ganglions lymphatiques (68). Comme les cellules polymorphonuclaires (PMN) sont les premires se rendre au site de linfection, elles sont les premires infectes par Leishmania. Il a t montr que linfection des PMN par L. major augmente la longvit de

19 ces PMN et induit une surproduction de MIP-1 , un agent chimioattracteur qui attire les macrophages au site de linfection. Les PMN apoptotiques sont ensuite phagocytes par les macrophages, qui seront leur tour infects par L. major (69). Les protines CCL2 et MIP-1 , des agents chimioattracteurs, seraient responsables de la chimioattraction des macrophages dans les lsions cutanes (66). Dans des cellules dendritiques exposes L. major, les rcepteurs de chimiokines CCR2 et CCR5 sont rprims tandis que le rcepteur CCR7 est surexprim. Cela diminue la chimiotaxie des cellules dendritiques CCL2 et MIP-1 tout en augmentant la sensibilit CCL21. Cette modulation est similaire chez des souris sensibles L. major et chez des souris rsistantes. De plus, il a t observ que la chimiokine CXCL10 tait exprime seulement chez les souris rsistantes L. major (70). Dans le cas de la leishmaniose cutane cause par L. mexicana, une forte expression de CCL2 et une expression modre MIP-1 causent une infection localise qui sera contenue par lhte tandis quune faible expression de CCL2 couple une haute expression de MIP-1 cause une dissmination de linfection qui gurira difficilement (71). Mme si plusieurs groupes de recherche ont tudi la raction immunitaire et les chimiokines impliques dans linfection de lhumain par Leishmania, dresser un juste portrait de ces interactions est difficile. En effet, peu dtudes comparent la raction de lhte selon lespce de Leishmania infectante (61). Lexpression diffrentielle des rcepteurs de chimiokines et dautres molcules de surface jouant un rle dans la migration des leucocytes pourrait avoir une influence importante sur la svrit et sur la forme de leishmaniose cause par chaque espce, notamment dans le cas de la leishmaniose viscrale.

2.6. Le gnome de LeishmaniaLes gnomes de trois espces de Leishmania, soit L. major, L. infantum et L. braziliensis, ont t squencs par le Wellcome Trust Sanger Institute et des versions de ces gnomes sont disponibles dans les bases de donnes GeneDB (72) et TriTrypDB (73). Le gnome de la souche Friedlin de L. major, qui mesure au total 32,8 Mb, est rparti sur

20 36 chromosomes ayant chacun une longueur de 0,28 Mb 2,8 Mb. Ce gnome a t squenc par le mlange de plusieurs approches, comme le squenage complet de cosmides, le squenage shotgun de chromosomes et le squenage de chromosomes artificiels bactriens (bacterial artificial chromosome ou BAC) (74). Au moment dtre publi, le squenage du gnome de L. major tait presque complet, puisquil ne restait que deux brches combler. Les gnomes des espces L. infantum (clone JPCM5) et L. braziliensis (clone M2904) ont t squencs par shotgun pour une couverture de 5 fois la longueur totale de leur gnome. La squence du gnome de L. infantum comprend 470 contigs dont le N50, cest--dire la longueur du contig pour lequel la somme des contigs plus grands correspond la moiti de la longueur du gnome, est 150 519 bases, alors que la squence de L. braziliensis comprend 1031 contigs dont le N50 est 57 789 bases (75). Le gnome de L. infantum mesure approximativement 33,5 Mb et est rparti sur 36 chromosomes. Le gnome de L. braziliensis a approximativement la mme taille que celui de L. infantum, mais il est rparti sur 35 chromosomes. Initialement, les chercheurs ont estim que le gnome de L. major contient 8370 gnes, que celui de L. infantum en possde 8195 et que celui de L. braziliensis en comprend 8312. Une premire version du gnome de L. mexicana est aussi disponible sur TriTrypDB, mais en version prliminaire.

2.6.1. La gnomique comparativeLobtention de la squence des gnomes des trypanosomatides (ou TriTryp), soit Trypanosoma cruzi, T. brucei et L. major, a permis une premire incursion dans ltude du gnome de ces organismes apparents (74, 76-78), mais ayant quand mme une distance volutive de 200 500 millions dannes (78). Ensuite, le squenage de L. infantum et de L. braziliensis a permis dvaluer avec plus de prcision ltendue des diffrences entre diffrentes espces de Leishmania (75). De plus, plusieurs autres parasites protozoaires ont t squencs, comme Plasmodium falciparum (75), responsable de la malaria, Entamoeba histolytica (79), qui cause une dysenterie, et Dictyostelium discoideum (80), une amibe vivant dans le sol. Enfin, plusieurs autres espces de Trypanosoma, de Leishmania, de Plasmodium et dEntamoeba sont diffrents stades de squenage.

21 2.6.1.1. La comparaison de Leishmania et Trypanosoma La comparaison des trois premiers trypanosomatides squencs a rvl une similitude importante entre ces organismes. Cependant, une diffrence majeure entre ces trois espces est la grande taille du gnome de T. cruzi, 55 Mb et environ 12 000 gnes, comparativement ceux de T. brucei, 25 Mb et 9068 gnes, et de L. major, 33 Mb et 8311 gnes. Lorsque les familles de gnes (clusters of orthologous groups ou COG) de chacune des espces ont t compares entre elles, 6158 familles de gnes taient communes entre les espces (23). Cela correspond environ 80 % des gnes de T. brucei et 93 % des gnes de L. major (78). T. cruzi a 3736 gnes spcifiques, T. brucei en a 1392 et L. major en a seulement 910. La plupart des gnes divergents entre les espces nont pas de fonction connue. Chanda et ses collaborateurs ont observ que les gnes fortement exprims chez les trypanosomes avaient subi moins de changements dans leurs squences protiques que les gnes moins exprims, en particulier chez L. major (81). La syntnie entre les trois espces, cest--dire la similarit entre la structure de leurs gnomes et lordre de leurs gnes, est trs leve : 68 % et 75 % des gnes de T. brucei et de L. major, respectivement, sont dans le mme ordre sur les chromosomes. Le taux de GC des trois espces est assez diffrent, soit 60 % pour L. major, 46 % pour T. brucei et 51 % pour T. cruzi. Lorsquadditionns, les blocs de syntnie de T. brucei et de L. major font 19,9 et 30,9 Mb, respectivement. Environ 40 % des bris de syntnie sont causs par lexpansion de familles de gnes ou par des rptitions en tandem contenant des rtrolments ou des ARN structuraux (23). De plus, 43 % des bris de syntnie se produisent prs des rgions de changement dorientation des groupes de gnes. Quelques lments distinguent les TriTryp des autres groupes dorganismes. Par exemple, le gnome des TriTryp code seulement pour 45 des 61 ARNt existants. Les TriTryp ont significativement moins de facteurs de transcription que les autres organismes. Cependant, ils ont plus de domaines CCCH-type zinc finger, ce qui suggre un contrle posttranscriptionnel accru. Une composante ncessaire linterfrence via lARN (ARNi) est prsente chez T. brucei, mais absente des deux autres espces. Aucun homologue de DICER, composant essentiel du processus de ARNi, nest prsent chez les TriTryp, mais

22 un homologue du domaine de ribonuclase III pourrait en compenser labsence chez T. brucei. Ce sont surtout les protines de surface qui diffrencient les espces. En effet, le nombre de gnes levs retrouv chez T. cruzi correspond en majeure partie des protines de surface rptes en tandem, comme les protines de surface associes la mucine (MASPS, > 1300 copies), les trans-sialidases (1430 copies), les mucines (863 copies) et les protases GP63 (565 copies). Le gnome de L. major code lui aussi pour de nombreuses protines de surface, quoiquelles soient prsentes en moins de copies. On peut citer, par exemple, les amastines, la tuzine, les lipophosphoglycanes (LPG), les glycosylinositolphospholipides (GIPL), les protophosphoglycanes (PPG) et les protines ancres la membrane par une ancre GPI, comme GP63, PSA-2 et GP46 (74). La mtalloprotase GP63 est la protine la plus abondante la surface du parasite chez linsecte (52). Les rgions subtlomriques favorisent une certaine diversit gnomique chez les trypanosomes, mais pas chez Leishmania. Chez Trypanosoma, les glycoprotines de surface squences variables (variable surface glycoproteins ou VSG) sont situes dans les rgions tlomriques ou subtlomriques. Ces VSG constituent linterface entre le parasite et le systme immunitaire de lhte. Ils le protgent contre la lyse mdie par le complment (82, 83). Le gnome des Trypanosoma contient des centaines, voir des milliers, de VSG diffrentes. Selon le stade de dveloppement du parasite, diffrents groupes de VSG peuvent tre exprims. Par contre, seulement une VSG la fois sera rellement utilise par le parasite. Les VSG sont sujets des recombinaisons mdies ou non par la protine RAD51, qui est aussi implique dans la recombinaison homologue et dans la rparation de lADN chez E. coli (84). Dans le cas de Leishmania, il semblerait que des gnes essentiels se retrouvent dans les rgions subtlomriques et quils ne soient pas sujets de fortes recombinaisons (75). tant donn la forte conservation de syntnie entre les TriTryp, il est fort probable quune certaine forme de slection maintienne la structure du gnome de Leishmania constante dans le temps. Lorganisation polycistronique (voir section 2.6.2) de ces gnomes pourrait tre favorise par certains lments de rgulation encore inconnus.

23 2.6.1.2. La comparaison des espces de Leishmania Jusquici, seulement trois espces de Leishmania ont t squences et compares sur la base dun gnome complet : L. major, L. infantum et L. braziliensis (75). En tout, moins de 200 gnes spcifiques une espce ont t trouvs chez les trois premires Leishmania squences. De plus, la syntnie est conserve sur plus de 99 % des gnes des trois gnomes. Ainsi, les protines potentielles de L. major et de L. infantum ont en moyenne 92 % didentit et la squence nuclotidique des gnes a environ 94 % didentit. Cependant, la comparaison de lune ou lautre de ces deux espces avec L. braziliensis donne une identit protique moyenne de 77 % et une identit nuclotidique qui varie de 81 82 %. Contrairement aux deux autres espces de Leishmania qui possdent 36 chromosomes, L. braziliensis en possde 35. En effet, le chromosome 20 de L. braziliensis constitue une fusion des chromosomes 20 et 34 trouvs chez les autres espces. Le gnome de Leishmania est compos de rptitions sur environ 10 % de sa squence. Peu de gnes ont t dcrits comme tant uniques une espce ou une autre. Selon Peacock et ses collaborateurs, seulement 5 gnes seraient spcifiques L. major, 26 L. infantum et 47 L. braziliensis. De plus, environ 47 gnes sont prsents chez L. infantum et L. major, mais absents chez L. braziliensis. Dans environ 80 % des cas, les gnes spcifiques une espce sont prsents chez les deux autres, mais sous une forme dgnre. Une autre portion des gnes diffrents rsultent dune amplification gnique suivie dune diversification. Seulement 34 % des gnes qui ne sont pas partags par toutes les espces ont pu tre associs une fonction. Dun autre ct, environ 8 % des gnes semblent avoir volu une vitesse diffrente entre les espces, ce qui suggre une slection positive de ces gnes. linstar de T. brucei, L. braziliensis est la seule Leishmania chez qui la machinerie ncessaire au processus dARN interfrence a t trouv (75). En effet, L. braziliensis semble contenir un homologue de DICER (LbrM23_V2.0390) ainsi quun homologue dArgonaute (AGO1). Il semble y avoir des vestiges dAGO1 sur les chromosomes 11 de L. major et de L. infantum, mais il est probable que le gne ait t perdu.

24 Selon Peacock et ses collaborateurs, les gnomes de L. major et de L. infantum contiennent peu dlments transposables, ce qui pourrait favoriser la stabilit chromosomique (75). Chez les autres trypanosomes, comme T. brucei et T. cruzi, on trouve plusieurs types de transposons, dont les rtroposons non-LTR ingi/L1Tc et SLACS/CZAR, et les rtroposons LTR VIPER. Contrairement L. infantum et L. major, des SLACS/CZAR sont associs aux mini-exons (voir section 2.6.2) de L. braziliensis et des lments transposables associs aux tlomres (telomere associated transposable elements ou TATE) ont t dcouverts prs de tlomres de cette espce. Leishmania possde aussi un autre type de rtroposon, le SIDER (short interspersed degenerated retroposons), qui peut tre spar en deux groupes : le SIDER1 et le SIDER2 (85). Les deux types de SIDER sont distribus de manire uniforme et syntnique dans le gnome de Leishmania. Cependant, lassociation de SIDER certaines catgories de gnes nest similaire dans les trois espces que dans 47 % des gnes orthologues. Bringaud et ses collaborateurs ont montr que le SIDER2 trouv dans la rgion non traduite en 3' des gnes favorise leur dgradation et diminue leur niveau dexpression (86). 2.6.1.3. La comparaison entre les espces de Plasmodium La squence complte de plusieurs parasites du genre Plasmodium a t dtermine par squenage en aveugle. Entre autres parasites squencs et compars entre eux, on trouve P. falciparum, responsable de la malaria humaine, P. yoelii yoelii, responsable de la malaria murine, P. vivax, responsable de 25 40 % des cas de malaria humaine, et P. knowlesi, qui cause la malaria chez le macaque et chez lhomme. Le gnome de ces espces est rparti sur 14 chromosomes haplodes, pour une taille de gnome qui varie de 23 26 Mb. Outre le fait que le gnome de Leishmania soit diplode et que celui de Plasmodium soit haplode, plusieurs lments distinguent ces deux parasites. En effet, P. falciparum est compos de 54 % de gnes qui contiennent des introns, alors que Leishmania nen contient aucun. Aussi, aucun lment transposable ou rtrotransposon na t dtect chez Plasmodium (87). De plus, davantage de diffrences sont observes entre les espces de Plasmodium quentre les espces de Leishmania. Ainsi, environ 80 % des gnes de P. knowlesi ont un gne orthologue chez P. falciparum et P. vivax, ce qui est trs diffrent

25 de ce qui a t observ chez les Leishmania, qui partagent environ 97,5 % de leurs gnes. Une partie de ces diffrences entre les espces consiste en lamplification de familles de gnes. Plus prcisment, il existe chez P. knowlesi 5 familles de gnes uniques et distinctes dont les fonctions sont inconnues et qui contiennent de 4 15 paralogues. 2.6.1.4. La biologie du dveloppement et la gnomique de Leishmania Le but de la biologie du dveloppement consiste dterminer la relation entre lvolution sur le plan gnomique et le phnotype observ au cours du dveloppement dun organisme. Les chercheurs de ce domaine sintressent particulirement aux eucaryotes pluricellulaires, comme le ver de terre, la mouche, la souris ou lhumain. Depuis plusieurs annes, le concept du gne goste dont le seul but serait de se rpliquer pour survivre est de moins en moins prvalent dans ce domaine et de nouvelles thories sur les diffrences entre les espces sont labores la lumire de ltude des gnomes. Chez les eucaryotes suprieurs, la dtermination des phnotypes dcoulerait surtout des rseaux forms par les gnes et les protines plutt que par les gnes seulement (88). Par exemple, la disparition dun gne important pourrait modifier le rseau qui sadapterait cette situation en formant dans la population des sous-rseaux diffrents. Ainsi, on ne devrait pas comparer les organismes en sappuyant seulement sur les diffrences nuclotidiques, qui se basent sur un changement graduel de squence au cours du temps. En effet, on devrait aussi tenir compte du nombre de copies de gnes, du transfert horizontal de gnes et de la rorganisation des chromosomes. La comparaison du gnome de 12 espces de drosophiles a montr que seulement 44 gnes taient spcifiques une espce (89). Comme il y a peu de diffrences gniques entre ces drosophiles, les chercheurs tudient maintenant les diffrences de rgulation entre les espces : lvolution des rseaux gniques devrait avoir plus dimpact que les gnes individuels (88). Ltude des diffrences entre les gnes dune mme famille entre deux espces pourrait aussi procurer des informations importantes. Cela est rsum par la thorie de lvolution morphologique, qui suggre que les organismes voluent surtout par altration de lexpression de gnes dont la fonction est conserve. Cette altration est cause en grande partie par des modifications dans les rgions rgulant ces gnes, ce qui modifie les rseaux gniques (90).

26 Cette vision de lvolution pourrait expliquer le peu de diffrences de gnes entre les espces de Leishmania, et mme entre les trypanosomes. Mme si elle est capable dchanger du matriel gnique lorsque deux souches co-infectent la mouche des sables (91), Leishmania ne sera probablement pas expose beaucoup de gnes exognes. Pour voluer, le parasite devrait donc se contenter de modifier et de rorganiser le matriel gntique quil possde dj. Comme Leishmania a tendance amplifier les gnes qui lui permettent de mieux sadapter son environnement, la diversification de ces amplifications gniques pourrait tre une approche utilise par le parasite pour varier ses comportements.

2.6.2. La rgulation de la transcriptionLa structure du gnome de Leishmania est singulire, car les gnes sont organiss en groupes orients dans la mme direction (74, 77, 92, 93). Par exemple, le gnome de L. major est organis en 133 groupes de gnes qui ne semblent pas tre runis selon leurs fonctions (74). Ces groupes peuvent atteindre une longueur de 1259 kb. Ils sont spars par des rgions de transition de longueur variant de 0,9 kb 1,4 kb et dont la composition en bases nest pas traditionnelle. Il a t suggr que ces groupes de gnes taient transcrits par une ARN polymrase de type II (ARNPII) qui dbuterait la transcription dans la rgion de transition et qui produirait des transcrits polycistroniques. Lanalyse du gnome de L. major a permis dobserver que certains groupes de gnes taient entrecoups par des ARN non codants qui seraient transcrits par une ARN polymrase de type III (ARNPIII). Cela suggre que ces groupes pourraient, en fait, en constituer plusieurs (74). La transcription nuclaire des gnes des trypanosomes est faite par trois types dARN polymrase. Ltude du chromosome 3 de L. major avec lalpha-amantadine, qui inhibe la ARNPII, et avec la tagtitoxine, qui inhibe slectivement la ARNPIII, a permis de dmontrer que la ARNPII tait responsable de la transcription des gnes, alors que la ARNPIII tait responsable de la transcription des ARNt chez L. major (94). LARN polymrase I (ARNPI) transcrit les ARN ribosomaux (ARNr) et, chez Trypanosoma brucei, transcrit en plus les glycoprotines de surface squences variables (VSG) responsables des variations antigniques de ce parasite, de mme que la EP-procycline. LARN polymrase II transcrit les ARN messagers et le splice-leader SL

27 RNA, aussi appel mini-exon . LARN polymrase III a trois classes de promoteurs, dont une est absente chez les trypanosomatides (95). La classe 1 rgule lexpression de lARNr 5S alors que la classe 2 rgule lexpression des ARNt. Malgr labsence de promoteurs de classe 3 chez les trypanosomes, les small nuclear RNA (snRNA) sont transcrits par le biais de promoteurs de classe 2. Jusqu prsent, aucune mthode de rgulation de lexpression des gnes par rgulation transcriptionnelle impliquant lARN polymrase II na t dmontre chez Leishmania. Plusieurs tudes suggrent que la transcription spcifique dbute dans la rgion de changement de brin entre deux units polycistroniques convergentes (94, 96, 97). Cependant, lARN polymrase II des trypanosomatides peut transcrire de lADN exogne au parasite, comme cela a t montr par la transcription de gnes rapporteurs insrs dans des cellules de Leishmania ou de Trypanosoma laide de plasmides (98). Lorganisation des gnes sur les chromosomes de Leishmania suggre que les gnes sont transcrits en longues units polycistroniques sans promoteurs spcifiques aux gnes. Une fois transcrits, ces ARN messagers doivent tre pisss en trans par lajout en 5' dun miniexon. Contrairement aux gnes transcrits par la ARNPII, le mini-exon a un promoteur particulier. De plus, le nombre de gnes codant pour le mini-exon varie de 100 200 copies successives par locus. Ces gnes reprsentent environ 6 % de la transcription cellulaire totale (95). Le mini-exon subira plusieurs modifications post-transcriptionnelles, incluant plusieurs types de mthylation et de pseudo-uridinations. Ainsi, il deviendra plus stable et davantage apte lier diffrentes protines qui participent la traduction des ARNm, comme eIF4E. Le mini-exon ainsi modifi joue le rle de coiffe. Il est possible que diffrentes structures de coiffes puissent tre lies par des protines diffrentes et, de ce fait, puissent avoir un profil de traduction diffrent (99). Les ARNm doivent aussi tre polyadnyls en 3'. Les chercheurs postulent que labondance des transcrits serait surtout rgie par des lments en cis qui affecteraient la stabilit et la modification des ARNm (100). De plus, une squence conserve de 450 nuclotides, situe en 3' des amastines de Leishmania, stimulerait la traduction de ces protines de surface en rponse au choc thermique induit par lhte humain (101). Cette squence appartient une famille de rtroposons, les SIDER.

28 Des chercheurs ont aussi suggr que la distribution de codons plus rares dans les gnes de Leishmania pourrait contribuer rduire la traduction de certains gnes (102). Une rorganisation de la chromatine pourrait galement jouer un rle dans la slection des rgions du gnome exprimer (103). Des tudes dimmunoprcipitation de la chromatine sur biopuce ont dailleurs mo