Bioinformatique en génomique évolutive

of 21/21
Bioinformatique en génomique évolutive Elsa Petit Parcours Projet actuel Projet futur Enseignement
  • date post

    24-Feb-2016
  • Category

    Documents

  • view

    48
  • download

    1

Embed Size (px)

description

ParcoursProjet actuelProjet futurEnseignement. Bioinformatique en génomique évolutive. Elsa Petit. Parcours Projet actuelProjet futurEnseignement. Parcours. 1997-2000: Ecole d’Ingénieurs des Travaux Agricoles, Bordeaux Option pathologie végétale - PowerPoint PPT Presentation

Transcript of Bioinformatique en génomique évolutive

Audition pour le poste MCF 1818 Universit Paris 11-Orsay

Bioinformatique en gnomique volutiveElsa PetitParcoursProjet actuelProjet futurEnseignement

Expos oral de 20 minutes organis en: 10 minutes de prsentation des travaux de recherche antrieurs, 5 minutes de prsentation d'un projet scientifique en relation avec les projets de l'quipe de recherche d'accueil du poste, 5 minutes de prsentation d'un projet pdagogique en relation avec les enseignements proposs par l'quipe pdagogique d'accueil du poste.1Parcours1997-2000: Ecole dIngnieurs des Travaux Agricoles, BordeauxOption pathologie vgtaleEt 1999: Iowa State University, Prvision de lanthracnose de la pastqueEt 2000: University of California, Effet de lenvironnement sur le risque doidium

2000-2005: Thse de pathologie vgtale, University of California, DavisContrle des champignons pathognes responsables de la maladie du pied-noir de la vigne 2005-2006: Ingnieur bioinformatique, Gnopole, EvryEntreprise Atragene, France

2006-2008: Post-doctorant, University of MassachusettsGnomique fonctionnelle des bactries

2009-2012: Professeur contractuel, Amherst CollegeGnomique volutive des champignons pathognes2013: ATER, Museum ParisGntique des populations, Drosophila simulans

* Priodes creuses en terme de recherche: 1 an de bnvolat et 1 an dans le priv

ParcoursProjet actuelProjet futurEnseignementrecherche est riche dune exprience longue a letranger2 stages aux Etats-Unis en ecole dingenieur thse aux Etats-Unis University of California, Davis en pathologie vegetale sur les causes et moyen de contrle dune maladie emergentegenopole-> programmation pour la bioinformatique- mon premier postdoctorat, genomique fonctionnelle des bacteriesprofessseur invite a Amherst College ou jenseigne et fait de la recherche en genomique evolutive des pathogenesDernierement ATER Museum genetique des populations Michel Veuille

Periodes creuses au niveau recherche: 1 an en recherche demploi et un an en entreprise-je vais maintenant expliquer brievement, les differents themes de recherche que jai aborde2Gnomique dune bactrie cellulolytique

Coordinatrice de lanalyse du gnome completPetit, E., et al.. 2012. Involvement of a bacterial microcompartment in the metabolism of fucose and rhamnose by Clostridium phytofermentans. PLoS ONE e54337.Petit, E., et al.. 2012. The genome and transcriptome of the bacterium Clostridium phytofermentans.(soumis).Blanchard J. L. , Leschine S., Petit E., and Fabel J. . 2010. Methods and compositions for improving the production of products in microorganisms. Brevet US20100028966.Gnomique fonctionnelle (Puces dexpression du gnome): comparaison sur 17 substrats dtection de gnes dintrt

ParcoursProjet actuelProjet futurEnseignementObjectif: Identification des gnes responsables des capacits gnralistes de la bactrie Clostridium phytofermentans

Premier postdoc, jai developpe de nombreuses methodes en programmation et genomique (coordonne lanalyse du genome complet dune bacterie) et en analyse du transcriptome

Brevet?

Conclusions3Evolution des chromosomes sexuels chez le champignon MicrobotryumObjectif: Dterminer si lvolution de la suppression de recombinaison sur les chromosomes sexuels des champignons est similaire celle des animaux et plantesCaractrisation de la taille de la zone non-recombinante (carte optique)

zone non-recombinantezones recombinantesa2a1ParcoursProjet actuelProjet futurEnseignement

a1a2

utilise techniques pour comprendre la genomique evolutive des chromosomes sexuels

Objectif: determiner si la dynamique evolutive des genes sur les chromosomes sexules des champignons est similaires a celle des animaux et plante.

Actuellement, les principaux modles pour ltude des chromosomes sexuels sont les animaux et les plantes, et les champignons restent trs peu explors.

Chez les animaux et les plantes, des strates volutives ont t observes, qui correspondent des zones o la difference genetique entre les chromosomes X et Y est de plus en plus leve quand on se rapproche du gne qui determine le sexe.

Certains parallles ont t voqus entre lvolution de la rgion non-recombinante chez les chromosomes de types sexuels chez les champignons etles chromosomes des animaux et des plantes pas evident

Mais champignons sont de tres bons modeles par la taille de leur genomes et le nombre de chromsomes reduits.

Chez Microbotryum, Les chromosomes des types sexues sont differenciables par caryotypes

Nous avons dabord determiner la taille de la zone non-recombinante grace a une carte optique de restriction enzymatique. 90% du chromosome ne recombine pas.

4Identification des gnes spcifiques aux chromosomes sexuelsRsultats:Preuves de lexistence de strates sont faibles chez les champignons en utilisant une approche phylogntique.ParcoursProjet actuelProjet futurEnseignementSporobolomycesMicrobotryum

Evolution des chromosomes sexuels chez le champignon MicrobotryumPetit, E., Giraud, T., et al. 2012. Linkage to the Mating-Type Locus across the Genus Microbotryum: Insights into non-recombining chromosomes. Evolution 66.Hood, M., Petit, E., & Giraud, T. 2013. Extensive divergence between mating type chromosomes of the anther-smut fungus. Genetics 193.Approche comparative de genomique ou jai annote les genes dans la region qui definit la compatibilite.

Jai identifi les gnes lis aux types sexuels par comparaison avec une espce proche, la levure rouge Sporobolomyces sp..

Jai determiner lage des strates par une approche phylogenetique qui compare levolution des ces regions cehz de nombreuses especes.

Conclusions?

5Gnomique de lhybridationLhybridation permet de comprendre la spciation

Modle Microbotryum:Cultivable facilementFacile croiserGnotypes haplodes Valeur slective des hybrides facile quantifierParcoursProjet actuelProjet futurEnseignement Sur le genre Dianthus, plusieurs espces de pathognes Microbotryum par espce dhte

Objectif: Rechercher lexistence dhybrides et les consquences gnomiques de lhybridation

Combine mes 2 interets sur levolution et les outils pour linformatique appliques au genomes

-Jai tudie plus particulirement le rle de la genomique des hybridations car elle permet de comprendre la speciation (revers de la meme piece), lhybridation genere aussi potentiellement de nouvelles especes.

Modele Microbotryum pour lhybridation car --cutivable facilement--croisements qui peuvent tre rpliqus exprimentalement --gnotypes haplodes (permettent dobserver les consquences de lhybridation au niveau de lhaploide)-- la valeur slective des hybrides est facile a quantifier dans des essais dinfections sur des plantes

-Objectids : determiner les consquences de la sympatrie des pathognes sur lhybridation et les flux de gnes ce qui est le sujet de ma recherche actuelle

- plusieurs espces cryptiques furent identifiees lintrieur du taxon Microbotryum violaceum

- bien que dans la plupart des cas un pathogne spcialis soit trouv par espce, certains htes comme Dianthus sont exceptionnels car ils sont parasits par plusieurs espces de Microbotryum souvent en sympatrie6MthodesEchantillonnage dans les Alpes6 espces dhtes Dianthus8 microsatellites, 235 individusRsultats3 espces de pathognes gnralistesHybrides entre toutes les espces

Gnomique de lhybridationParcoursProjet actuelProjet futurEnseignement

- ces etudes utilisent le concept de cluster pour identifier les individus hybrids et especes parentes et est le plus adapte a lexistence des hybrids: permettant le croisement despeces et pas seulement la bifurcation despeces existentesmicrosat: petites sequences repetees, tres variables et qui sont souvent neutres aux niveau evolutif ce qui evite de regarder un type de selection specifiqueInstruct avec 8 microsat, a permis de calculer le niveau de pourcentage des allees dun indvidu qui appartiennent a un cluster (ici 3 clusters taient le plus appropris car 4 clusters simplement spars un cluster en deux avec des pourcentage dappartenance a tout cluster tres bas).-Il apparait quil exite plusieurs especes (confirme par une approche phylogenetique) hybrides existent naturellement entre les 3 especes 7Gnomique de lhybridationDistribution selon la gographie Absence de spcificit lhteSympatrieHybrides en prsence de leur parents

ParcoursProjet actuelProjet futurEnseignement

7.07.27.47.67.88.08.28.444.044.244.4

44.6La distribution de lhote na pas deffet.

les genomes hybrides sont distribues dans lespace selon la sympatrie du pathogene.

Sympatrie semble indispensable car la ou il y a des hyrbides les especes du pathogenes sont en sympatrie.

Pas dhybrides trouves en populations isolees ce qui veut dire que lhyrbide est toujorus a proximite et en competition avec ces parents.

8Nombre de copies par PCR quantitativeParcoursProjet actuelProjet futurEnseignementGnomique de lhybridation

Objectif: Dterminer les consquences gnomiques de lhybridation

Exemple de la prolifration des lments transposables (type copia)

Pourcentage du gnome par 454

Que se passe-t-il au niveau genomique qui expliquerait les difficultes de ces hybrides a sinstaller?

-barriere a lhybridation existent: prezygotic (prevention avant la rencontre): pas le cas ici, postzygotique barriere si les individus sont capables de se rencontrer (viabilite, fertilite), mais surtout le fitness reduit par rapport aux parents et aussi les chances de rencontrer le parent comme partenaire sont plus eleves que de recontrer un hybride (dilution genetique avec leur parent) introgression

9Gntique des populations: Drosophila simulansParcoursProjet actuelProjet futurEnseignement

Objectif: Historique dmographique de la colonisation de lEurope depuis lAfrique

15 individus par population en Afrique et en Europe pour D. melanogaster and D. simulansSquences de 44 loci Comparaison de scnarios avec simulation ABC:Quand a eu lieu la migration depuis lAfrique?Taille du goulet dtranglement?Variation des tailles efficaces au cours du temps?Flux de gnes entre les 2 populations?

15 individus par population en Afrique et en Europe pour D. melanogaster and D. simulansSquences de 44 loci Simulation ABC

10Plateforme danalyse RNAseq de novoParcoursProjet actuelProjet futurEnseignementObjectif: Dvelopper une plateforme danalyse pour lassemblage RNA-Seq pour les organismes dont le gnome complet nest pas disponible et qui rpondent a des questions volutives

Les tudes transcriptomiques ont traditionnellement t rserves aux organismes modles. Pour des modles comme lhomme, Arabidopsis ou la drosophile, des ressources gnomiques importantes permettent la conception de puces qui examinent les changements globaux de transcription. Les organismes non modles furent longtemps cantonns utiliser les qPCRs pour des gnes connus.Les techniques qui paralllisent le squenage dARN (RNA-Seq) permettent davoir des millions de fragments dARN sur des organismes dont le gnome nest pas squenc et offrent de faon concomitante des mesures de changement dexpression et une information sur la squence (Ozsolak & Milos, 2011). Par rapport aux analyses sur puces, il est possible de dtecter des transcrits inconnus ou de dcouvrir de nouveaux niveaux de complexit tel que lexpression dallles spcifiques ou de nouvelles variations dARN issus de lpissage alternatif. Il nest donc pas surprenant que lRNASeq devienne une technologie de choix pour la comprhension des transcriptomes. Malgr ces intrts, la plupart des utilisations concernent lanalyse de lexpression diffrencie, techniques principalement utilisables par les puces alors que lRNA-Seq pour lassemblage de novo semble sous-utilise (Fig. 1). Ceci peut tre expliqu par un manque critique pour lanalyse bioinformatique de donnes de squenage haut dbit. Le premier projet consistera donc dvelopper une plateforme danalyse pour lassemblage de novo RNA-Seq qui servira aussi comme moyen de communication entre bioinformaticiens et biologistes.

11ParcoursProjet actuelProjet futurEnseignementPas besoin dorganismes modles squencsAssemblage de transcrits -> facilit par des tailles des fragments de plus en plus grandes

Gene 1Gene 2Contig 1 Gene 1Contig 1 Gene 2Contig 2 Gene 2Plateforme danalyse RNAseq de novoLapproche consistera dvelopper une plateforme danalyse pour lassemblage RNA-Seq de novo pour les organismes dont le gnome complet nest pas disponible.

Transcriptome= Taille du genome/1000 pour bacteria but change

2eme papiers sur RNA seq RPMK method Mortazavi 2006 gene count/ gene lgt*seq depth

Illumina plus prevalent: 8 lignes, 160 million reads of 35-400 bp

12ParcoursProjet actuelProjet futurEnseignementExtraction ARNType de sequencage, multiplexage, nombre dechantillons Contrles qualits, normalisationSquenage cDNAAssemblage de novoAnnotationComptageSlectionAnalyse de lexpression diffrencieDtection des variationsEnrichissement fonctionnelAlignementsPlateforme danalyse RNAseq de novoJusquici, des algorithmes isols de lanalyse ont t explors qui inclus lassemblage de novo (Chu et al., 2013) mais il reste a mettre en place une analyse complte et automatise (Fig. 2).cleaned up the raw data, so that they can be used for creating a de novo assembly Low quality bases and adapter sequences have been removed. also veriy that the reads are not all identical, which would suggest an error somewhere in the sample preparation pipeline. examined the trimmed dataset to make sure that quality scores are high and that nucleotides are evenly distributed.Theobjectivesofthissectionareto1)retrievethebestmatchesintheNRandUniprotatabasesforourassembledcontigs,and2)createametatablethatsummarizesthevailableannotationinformationforeachcontig.The objectives of this section are to 1) merge your alignment files and realign poorly mapped regions, 2) detect variant sites and filter out true sites from false positives, 3) extract genotype information for all individuals at all variant sites, 4) calculate allele and genotype frequencies, 5) perform a Principal Components Analysis to find largescale ifferences between populations, and 6) perform an FST outlier analysis to find loci potentially under selection.

13Insertion dans le laboratoire daccueilParcoursProjet actuelProjet futurEnseignementMon programme:RNAseq de novoEvolutionGnomique des populationsFrance GnomiqueInstitut de Biologie Paris SeineEquipe Pr. Le Crom

Squenceur illuminaExpertisesPlateforme Eoulsan de gnomique fonctionnelle

-Ces recherches mont permis dacqurir une approche multidisciplinaire avec une connaissance solide des techniques exprimentales et analytique en gnomique/informatique. -forger un rseau de collaborations solides avec des expertises allant de la gnomique lvolution

-Principales interactions avec le laboratoire de biologie Paris Seine, equipe Pr Le Crom, France genomique

14Questions biologiques : divergence adaptativeParcoursProjet actuelProjet futurEnseignementDes adaptations au mme environnement impliquent-elles les mmes gnes ou mutations ?Quelle proportion du gnome est implique dans ladaptation?

15EnseignementCours enseigns en anglaisMycologie (60h, 40 tudiants)Microbiologie (10h, 100 tudiants)Ecologie des Maladies Infectieuses (120h, 10 tudiants)Biologie des Gnomes (60h, 25 tudiants) ParcoursProjet actuelProjet futurEnseignement

Projet denseignement Formation pdagogique utile pour enseigner en amphithtreEffectifs et publics varisSujet connu de la bioinformatiqueSlectionne pour formation pdagogique First IV (National Science Foundation)enseigner la science comme elle est pratique Durant mon doctorat et mon post-doctorat, jai consacr un temps important lenseignement et lencadrement des tudiants. Jai enseign plusieurs cours utilisant les methodes classiques denseignement en anglais:Introduction la Mycologie, Microbiologie Gnrale, Biologie des Gnomes, une tude de larchitecture et des interactions des systmes gntiques qui utilisent les nouvelles technologies de la gnomique. Nous couvrons lorganisation de linformation hrditaire et son influence sur lvolution des espces long terme. Entre autre, nous prsentons des techniques aidant utiliser lnorme quantit de donnes disponibles issues de lavance de la gnomique au cours de TDs et projets indpendants. Ecologie des maladies infectieuses

Jai t slectionne pour tre forme et pour mettre en place le projet FIRST IV financ par la National Science Foundation pourenseigner la science comme elle est pratique. Integration:

-mon exp large + enseignement avec diffrents styles, types de publics me permettront detre flexible par rapport aux cours a enseigner.

-exprience pedagogique de Frist 4 propose des techniques pour engager les etudiants dans des classes de grands effectifs(amphi)

-Sujets familiers de diversite, origine faire une diapos ou met les cours exacts?

16InformatiqueParcoursProjet actuelProjet futurEnseignementInformatique niveau 1 et optionnel(License)Utilisation du terminalCration dalgorithmesInitiation a la programmation

Mon exprienceCours dalgorithmes cole dingnieurUtilisation courante pour ma rechercheProgrammation en Python, Perl, R

Ecrire Entrer un nombreLire NN