Toxicologie de l arsenic et de ses composés : importance ...
Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de...
-
Upload
yolande-guyon -
Category
Documents
-
view
107 -
download
1
Transcript of Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de...
Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur
Activités et projets de l’équipeAtelier de Génomique Comparative
Rôle de l’Atelier de Génomique Comparative au sein du GDR
ArsenicResp. Claudine Médigue
Laurent Labarre
Thèses :
Géraldine Pascal David Vallenet
Stéphane Cruveiller
Post-doctorants :
Stéphanie Bocs
(Etudiant Chinois enthèse courant 2005)
Zoé Rouy
Ingénieurs :
Aurélie Lajus
Stagiaire : Catherine Devaud
Thématiques de l’équipe AGC
(Ré)-Annotation de génomes bactériens
Applications biologiques
Génomique comparative : régions conservées et/ou spécifiques, fusions de gènes, voies métaboliques.
Composition en codons et en acides aminés des séquences bactériennes.
Méthodes (Langage C, Perl) et Stratégies d’analyse (Java)
Développements méthodologiques :
Interfaces graphiques Serveurs Web
(Langages PHP, HTML)
Base multigénomes PkGDB (Prokaryotic Genome DataBase)
Développements de bases de données
Bases thématiques pour des projets de (ré)-annotation Bases de connaissances (plateforme de génomique exploratoire
Genostar)
• SGBD relationnel (MySQL)SGBD relationnel (MySQL)
PkGDB : Procaryotic Genome DataBase
Objectif : données d’annotation ‘propres’, cohérentes, à la source des méthodologies de génomique comparative
• Résultats d’analysesRésultats d’analyses : : Intrinsèques : gènes, signaux, répétitions,…
• Génomes nouveauxGénomes nouveaux (projets d’annotation)(projets d’annotation)
Extrinsèques : Blast, InterPro, COG, synténies …
• Génomes completsGénomes complets (Refseq NCBI)(Refseq NCBI)
Ré-annotation syntaxique
Intégration dans PkGDB
Gestion des ‘frameshifts’
Homogénéité des données
Complétion /correction des données
AMIMat : analyse de l’usage des codons des génomes bactériensObjectif : caractériser des groupes de gènes homogènes dans l’usage des codons au sein d’un génome bactérien.
Modèle objet AROM (java)
PkGDB
Modèle relationnelClass III
(397)
Class I(1791)
Class II(1551)
Class IV(256)
AFCClustering
http://www.genoscope.cns.fr/agc/tools/micheck/html/database_status.html
AMIGene : prédiction de gènes codants bactériens
Objectif : Détecter les gènes de composition atypique et les petits gènes
start stop
Patterns starts/stops
+ RBS (RBS-Finder)P(X/X1...Xk)
Matrice(s) de transitions
w
phase 1
phase 2
phase 3
+ +Heuristique desélection des CDSsles plus probables
ChevauchementsInclusions, …
Class III(397)
Class I(1791)
Class II(1551)
Class IV(256)
GeneMark
http://www.genoscope.cns.fr/agc/tools/amigene
Bocs et al. (2003) AMIGene: Annotation of MIcrobial Genes. Nucleic Acids Research, 31, 3723-3726.
MICheck : ré-annotation (syntaxique) de génomes bactériensObjectif : Vérifier rapidement si les annotations répertoriées dans les banques de séquences pour un génome donné sont complètes.
Fichier EMBL ou GenBankSéq. nucl Annotations
+Modèle(s) de gènes
CDS prédites
Calcul de la probabilitémoyenne de codage
Gènes annotésCOMPARAISONPosition des codons stop
CDS communes CDS UNIQUESBanques
CDS UNIQUESAMIGene
Cruveiller et al. (2005) MICheck : A Web tool to fast check annotations of bacterial genomes. Nucleic Acid Research (en révision)
http://www.genoscope.cns.fr/agc/tools/micheck
Syntonizer : Groupes de synténies dans les génomes bactériensObjectif : Détecter des groupes de gènes ‘localement’ conserver dans les génomes bactériens.
http://www.genoscope.cns.fr/agc/tools/syntonizer
Labarre et al. Syntonizer: an interactive Web tool for identifying bacterial synteny group using multiple correspondences. (soumis BMC Bioinf.).
Rearrangement Fusion Duplication Insertion Inversion
A
B
Synteny Group #2 Synteny Group #1
MaGe : plateforme d’annotation de génomes bactériens
PkGDB
AcinetoDB
YersiniaScope
HaloplanktisDB
BacillusScope ColiScope
FrankiaDB
Databases for re-annotation and annotation projects
MySQLDBBlast
tRNAscan-SE
InterProScan
PRIAM
COGnitor
TMHMM
Automatic functional assignment combining multiple evidence and
synteny results
«Auto-FAssign»
GRAPHICAL ANNOTATION INTERFACE(Web server connected to the data base)
Validation and completion of the automatic annotation
(Re) Annotation using synteny results
User friendly and adaptable annotator editor
Vallenet et al. MaGe - a microbial genome annotation system supported by synteny results. (en préparation)
http://www.genoscope.cns.fr/agc/mage/project _name
Bacterial annotation projects in progress :
project _name = AcinetoScope (Acinetobacter sp. ADP1)
Login name and password are required.
Available re-annotation and annotation projects :
= YersiniaScope (Yersinia species)
= BacillusScope (Bacillus species)
Connection à MaGe
Projet MicroScope (ACI IMPBio 2004)
Bases de données thématiques pour l’annotation/ré-annotationde génomes bactériens
Aujourd’hui : 12 projets en cours + 2 en préparation
Formation et suivit des utilisateurs(outils d’annotation et interface MaGe)
Optimisation de l’architecture des bases et des ressources machines(Equipe informatique de Claude Scarpelli)
Gestion efficace des mises à jour des données(avancée du “Finishing”/update des banques de séquence)
Développement et maintenance des bases thématiques Analyse complète d’un génome nouvellement séquencé Recherche de synténies avec l’ensemble des procaryotes complets
Mise à la disposition des données via l’interface MaGe
Métabolisme bactérien:Connection à KEGG + construction de la base BioCyc (P. Karp)
Bactéries de l’environnement et symbiotes de plantes
BD Bactérie(s) SéquençageCollaborateurs
AcinetoScope AcinetobacterADP1
Environnement (sol) P. Marlière (Evologic) &N. Orlston (Yale U., USA)
Genoscope
PsychroScope Pseudomonashaloplanktis
GenoscopeEnvironnement (antartique) A. Danchin (IP, Paris)
FrankiaScope
CloacaScope
ArseniScope
BradyrhizoScope
AnnamoScope Kueneniastuttgartiensis
Environnement(métabolise l’N)
Genoscope
Frankia alniSymbiote de plantes
P. Normand (Lyon) Genoscope
M Jetten(Univ. Nijmegen, Holl.)
Métagénomes Microflore de la stationd’épuration des eaux d’Evry
D. Le Paslier & A. Sghir(Genoscope, Evry)
Genoscope
Cenibacteriumarsenoxidans Environnement
(Métabolise l’arsenic)P. Bertin
(ULP, Strasbourg)Consortium GDR Arsenic
Genoscope
Bradyrhizobiumsp. ORS278
Symbiote de plantes E. Giraud(LSTM, Montpellier)
Genoscope
Frankia sp. CcI3Frankia sp. EAN1
DOE JGID. Benson
(Univ. Connecticut, USA)
Thiomonas spp.
Taille génome : 3424 326 pb %GC = 54.3 % Les gènes de RNA
• 45 tRNA au total, tous les acides aminés sont représentés
• 2 clusters de rRNA : 16S 23S 5S, au début du génome
Caractéristiques générales du génome de C. arsenoxidans
3376 CDSs annotées Les gènes de protéines :
- fonctions «connues» : 2127 / 63 %- conserved hypothetical : 607 / 18 %- hypothetical protein : 642 / 19 %
36.8% «definitive assignment»
26.2% «putative assignment»
Parmi les similarités « significatives » :
- Resistance : 40 / 1.2% (Arsenic, Cobalt-zinc-cadmium, Copper, multidrug,…)
- Regulators : 136 / 4 %- Transports : 191 / 5.7 %- DNA replication, recombinaison,
modification and repair : 89 / 2.4 %- Related to phage,transposase : 51 / 1.5 %- Reductases : 93 / 2.8 %
C. arsenoxydans3376 predicted CDSs
versus Organism
CDSs in synton % CDSs in synton
Number of syntons
% CDSs in synton Name CDSs in synton Annotated CDSs
1400 42.1 % 263 40.6% R. solanacearum 1397 3440
1316 39.6 % 248 38.2 % B. pseudomallei 1300 3399
1239 37.3 % 319 29.7 % B. parapertussis 1243 4185
1191 35.8 % 294 28.8 % Azoarcus sp. 1192 4133
1066 32.1 % 316 24.8 % C. violaceum 1091 4407
1053 31.7 % 313 18.9 % P. aeruginosa 1054 5567
928 27.9 % 279 21.7 % X. axonopolis 935 4312
873 26.3 % 260 20.6 % S. oneidensis 889 4324
844 25.4 % 246 18.7 % E. carotovora 838 4472
801 24.1 % 234 18.2 % S. enterica 800 4395
798 24.0 % 250 18.8 % E. coli K12 798 4242
787 23.7 % 228 29.3 % I. ioihiensis 771 2628
786 23.6% 227 26.9 % V. vulnificus 794 2952
784 23.6 % 222 23.2 % P. profundum 792 3416
761 22.9 % 271 22.5 % Acinetobacter ADP1 748 3325
583 17.5 % 204 16.9 % G. sulfurreducens 584 3446
559 16.8 % 181 26.6 % N. meningitidis 550 2065
438 13.2 % 147 26.7 % H. influenzae 442 1657
404 12.1 % 139 10.1 % B. subtilis 415 4105
267 8.0 % 86 14.3 % R. solanacearum Mp 239 1676
198 5.9 % 79 6 % Synechocyctis 190 3166
Groupes de synténies entre C. arsenoxydans et quelques génomes
Synténies et voies métaboliques
leuC
leuDleuB
asd
CENAR1163
truA
trpFtrpB trpA
accD
folC
Synténie S. oneidensis et C. arsenoxydans
Synténies et voies métaboliques
leuC
leuDleuB
asd
CENAR1163
truA
trpFtrpB trpA
accD
folC
1.2.1.33
6.4.1.25.3.1.24
4.2.1.20
1.1.1.85
6.3.2.12
Enzymes encoded by genes in the MaGe region
Additional enzymes in E. coli
Connectivité à la base métabolique KEGG
Enzymes encoded by genes elsewhere in the C. arsenoxydans genome
Editeur d’annotation de MaGe (partiel)
Lien MaGe - Bases de données BioCyc (P. Karp)
Voie de biosynthèse de la Leucine chez C. arsenoxydans
Show Pathway Report
Show Pathway Hole Report
Reconstitution des voies métaboliques chez C. arsenoxydans
Résistance à l’arsenic …
Arsenite oxydase
aoxCBA
ABC transporters (pts)
2-component reg. systatoC
Acetoacetatemetabolism
lipoprotein Arsenical resistance
arsR-like
arsC-like
arsCArsenatereductase
arsB
Arsenicalpump
Rôle de l’AGC dans le cadre du GDR arsenic
Construction de la base thématique ArseniScope:
Génomes de C. arsenoxydans et de Thiomonas spp. Intégration à MaGe d’autres génomes très proches en cours de séquençage ? Calculs des synténies et régions uniques Mise en place des bases BioCyc
Assitance à l’annotation experte des génomes
Organisation d’une formation à MaGe Support continu aux annotateurs
Métagénomique (arsenic) Modification de MaGe pour la gestion et l’annotation de ‘métagénome’ Création de catalogues de gènes et de familles de protéine
Bases de données multigénomes
Construction de bases GenoList (Antoine D., I. Moszer) Interface d’interrogation et de navigation dans les bases thématiques
multigénomes (PkGDB)