Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de...

23
Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de l’équipe Atelier de Génomique Comparative Rôle de l’Atelier de Génomique Comparative au sein du GDR Arsenic Resp. Claudine Médigue Laurent Labarre Thèses : Géraldine Pascal David Vallenet Stéphane Cruveiller Post-doctorants : Stéphanie Bocs (Etudiant Chinois en thèse courant 2005) Zoé Rouy Ingénieurs : Aurélie Lajus Stagiaire : Catherine Devaud

Transcript of Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de...

Page 1: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur

Activités et projets de l’équipeAtelier de Génomique Comparative

Rôle de l’Atelier de Génomique Comparative au sein du GDR

ArsenicResp. Claudine Médigue

Laurent Labarre

Thèses :

Géraldine Pascal David Vallenet

Stéphane Cruveiller

Post-doctorants :

Stéphanie Bocs

(Etudiant Chinois enthèse courant 2005)

Zoé Rouy

Ingénieurs :

Aurélie Lajus

Stagiaire : Catherine Devaud

Page 2: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Thématiques de l’équipe AGC

(Ré)-Annotation de génomes bactériens

Applications biologiques

Génomique comparative : régions conservées et/ou spécifiques, fusions de gènes, voies métaboliques.

Composition en codons et en acides aminés des séquences bactériennes.

Méthodes (Langage C, Perl) et Stratégies d’analyse (Java)

Développements méthodologiques :

Interfaces graphiques Serveurs Web

(Langages PHP, HTML)

Base multigénomes PkGDB (Prokaryotic Genome DataBase)

Développements de bases de données

Bases thématiques pour des projets de (ré)-annotation Bases de connaissances (plateforme de génomique exploratoire

Genostar)

Page 3: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

• SGBD relationnel (MySQL)SGBD relationnel (MySQL)

PkGDB : Procaryotic Genome DataBase

Objectif : données d’annotation ‘propres’, cohérentes, à la source des méthodologies de génomique comparative

• Résultats d’analysesRésultats d’analyses : : Intrinsèques : gènes, signaux, répétitions,…

• Génomes nouveauxGénomes nouveaux (projets d’annotation)(projets d’annotation)

Extrinsèques : Blast, InterPro, COG, synténies …

• Génomes completsGénomes complets (Refseq NCBI)(Refseq NCBI)

Ré-annotation syntaxique

Intégration dans PkGDB

Gestion des ‘frameshifts’

Homogénéité des données

Complétion /correction des données

Page 4: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

AMIMat : analyse de l’usage des codons des génomes bactériensObjectif : caractériser des groupes de gènes homogènes dans l’usage des codons au sein d’un génome bactérien.

Modèle objet AROM (java)

PkGDB

Modèle relationnelClass III

(397)

Class I(1791)

Class II(1551)

Class IV(256)

AFCClustering

http://www.genoscope.cns.fr/agc/tools/micheck/html/database_status.html

Page 5: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

AMIGene : prédiction de gènes codants bactériens

Objectif : Détecter les gènes de composition atypique et les petits gènes

start stop

Patterns starts/stops

+ RBS (RBS-Finder)P(X/X1...Xk)

Matrice(s) de transitions

w

phase 1

phase 2

phase 3

+ +Heuristique desélection des CDSsles plus probables

ChevauchementsInclusions, …

Class III(397)

Class I(1791)

Class II(1551)

Class IV(256)

GeneMark

http://www.genoscope.cns.fr/agc/tools/amigene

Bocs et al. (2003) AMIGene: Annotation of MIcrobial Genes. Nucleic Acids Research, 31, 3723-3726.

Page 6: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

MICheck : ré-annotation (syntaxique) de génomes bactériensObjectif : Vérifier rapidement si les annotations répertoriées dans les banques de séquences pour un génome donné sont complètes.

Fichier EMBL ou GenBankSéq. nucl Annotations

+Modèle(s) de gènes

CDS prédites

Calcul de la probabilitémoyenne de codage

Gènes annotésCOMPARAISONPosition des codons stop

CDS communes CDS UNIQUESBanques

CDS UNIQUESAMIGene

Cruveiller et al. (2005) MICheck : A Web tool to fast check annotations of bacterial genomes. Nucleic Acid Research (en révision)

http://www.genoscope.cns.fr/agc/tools/micheck

Page 7: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Syntonizer : Groupes de synténies dans les génomes bactériensObjectif : Détecter des groupes de gènes ‘localement’ conserver dans les génomes bactériens.

http://www.genoscope.cns.fr/agc/tools/syntonizer

Labarre et al. Syntonizer: an interactive Web tool for identifying bacterial synteny group using multiple correspondences. (soumis BMC Bioinf.).

Rearrangement Fusion Duplication Insertion Inversion

A

B

Synteny Group #2 Synteny Group #1

Page 8: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

MaGe : plateforme d’annotation de génomes bactériens

PkGDB

AcinetoDB

YersiniaScope

HaloplanktisDB

BacillusScope ColiScope

FrankiaDB

Databases for re-annotation and annotation projects

MySQLDBBlast

tRNAscan-SE

InterProScan

PRIAM

COGnitor

TMHMM

Automatic functional assignment combining multiple evidence and

synteny results

«Auto-FAssign»

GRAPHICAL ANNOTATION INTERFACE(Web server connected to the data base)

Validation and completion of the automatic annotation

(Re) Annotation using synteny results

User friendly and adaptable annotator editor

Vallenet et al. MaGe - a microbial genome annotation system supported by synteny results. (en préparation)

Page 9: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

http://www.genoscope.cns.fr/agc/mage/project _name

Bacterial annotation projects in progress :

project _name = AcinetoScope (Acinetobacter sp. ADP1)

Login name and password are required.

Available re-annotation and annotation projects :

= YersiniaScope (Yersinia species)

= BacillusScope (Bacillus species)

Connection à MaGe

Page 10: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Projet MicroScope (ACI IMPBio 2004)

Bases de données thématiques pour l’annotation/ré-annotationde génomes bactériens

Aujourd’hui : 12 projets en cours + 2 en préparation

Formation et suivit des utilisateurs(outils d’annotation et interface MaGe)

Optimisation de l’architecture des bases et des ressources machines(Equipe informatique de Claude Scarpelli)

Gestion efficace des mises à jour des données(avancée du “Finishing”/update des banques de séquence)

Développement et maintenance des bases thématiques Analyse complète d’un génome nouvellement séquencé Recherche de synténies avec l’ensemble des procaryotes complets

Mise à la disposition des données via l’interface MaGe

Métabolisme bactérien:Connection à KEGG + construction de la base BioCyc (P. Karp)

Page 11: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Bactéries de l’environnement et symbiotes de plantes

BD Bactérie(s) SéquençageCollaborateurs

AcinetoScope AcinetobacterADP1

Environnement (sol) P. Marlière (Evologic) &N. Orlston (Yale U., USA)

Genoscope

PsychroScope Pseudomonashaloplanktis

GenoscopeEnvironnement (antartique) A. Danchin (IP, Paris)

FrankiaScope

CloacaScope

ArseniScope

BradyrhizoScope

AnnamoScope Kueneniastuttgartiensis

Environnement(métabolise l’N)

Genoscope

Frankia alniSymbiote de plantes

P. Normand (Lyon) Genoscope

M Jetten(Univ. Nijmegen, Holl.)

Métagénomes Microflore de la stationd’épuration des eaux d’Evry

D. Le Paslier & A. Sghir(Genoscope, Evry)

Genoscope

Cenibacteriumarsenoxidans Environnement

(Métabolise l’arsenic)P. Bertin

(ULP, Strasbourg)Consortium GDR Arsenic

Genoscope

Bradyrhizobiumsp. ORS278

Symbiote de plantes E. Giraud(LSTM, Montpellier)

Genoscope

Frankia sp. CcI3Frankia sp. EAN1

DOE JGID. Benson

(Univ. Connecticut, USA)

Thiomonas spp.

Page 12: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Taille génome : 3424 326 pb %GC = 54.3 % Les gènes de RNA

• 45 tRNA au total, tous les acides aminés sont représentés

• 2 clusters de rRNA : 16S 23S 5S, au début du génome

Caractéristiques générales du génome de C. arsenoxidans

3376 CDSs annotées Les gènes de protéines :

- fonctions «connues» : 2127 / 63 %- conserved hypothetical : 607 / 18 %- hypothetical protein : 642 / 19 %

36.8% «definitive assignment»

26.2% «putative assignment»

Parmi les similarités « significatives » :

- Resistance : 40 / 1.2% (Arsenic, Cobalt-zinc-cadmium, Copper, multidrug,…)

- Regulators : 136 / 4 %- Transports : 191 / 5.7 %- DNA replication, recombinaison,

modification and repair : 89 / 2.4 %- Related to phage,transposase : 51 / 1.5 %- Reductases : 93 / 2.8 %

Page 13: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

C. arsenoxydans3376 predicted CDSs

versus Organism

CDSs in synton % CDSs in synton

Number of syntons

% CDSs in synton Name CDSs in synton Annotated CDSs

1400 42.1 % 263 40.6% R. solanacearum 1397 3440

1316 39.6 % 248 38.2 % B. pseudomallei 1300 3399

1239 37.3 % 319 29.7 % B. parapertussis 1243 4185

1191 35.8 % 294 28.8 % Azoarcus sp. 1192 4133

1066 32.1 % 316 24.8 % C. violaceum 1091 4407

1053 31.7 % 313 18.9 % P. aeruginosa 1054 5567

928 27.9 % 279 21.7 % X. axonopolis 935 4312

873 26.3 % 260 20.6 % S. oneidensis 889 4324

844 25.4 % 246 18.7 % E. carotovora 838 4472

801 24.1 % 234 18.2 % S. enterica 800 4395

798 24.0 % 250 18.8 % E. coli K12 798 4242

787 23.7 % 228 29.3 % I. ioihiensis 771 2628

786 23.6% 227 26.9 % V. vulnificus 794 2952

784 23.6 % 222 23.2 % P. profundum 792 3416

761 22.9 % 271 22.5 % Acinetobacter ADP1 748 3325

583 17.5 % 204 16.9 % G. sulfurreducens 584 3446

559 16.8 % 181 26.6 % N. meningitidis 550 2065

438 13.2 % 147 26.7 % H. influenzae 442 1657

404 12.1 % 139 10.1 % B. subtilis 415 4105

267 8.0 % 86 14.3 % R. solanacearum Mp 239 1676

198 5.9 % 79 6 % Synechocyctis 190 3166

Groupes de synténies entre C. arsenoxydans et quelques génomes

Page 14: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Synténies et voies métaboliques

leuC

leuDleuB

asd

CENAR1163

truA

trpFtrpB trpA

accD

folC

Page 15: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Synténie S. oneidensis et C. arsenoxydans

Page 16: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Synténies et voies métaboliques

leuC

leuDleuB

asd

CENAR1163

truA

trpFtrpB trpA

accD

folC

1.2.1.33

6.4.1.25.3.1.24

4.2.1.20

1.1.1.85

6.3.2.12

Page 17: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Enzymes encoded by genes in the MaGe region

Additional enzymes in E. coli

Connectivité à la base métabolique KEGG

Enzymes encoded by genes elsewhere in the C. arsenoxydans genome

Page 18: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Editeur d’annotation de MaGe (partiel)

Page 19: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Lien MaGe - Bases de données BioCyc (P. Karp)

Page 20: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Voie de biosynthèse de la Leucine chez C. arsenoxydans

Page 21: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Show Pathway Report

Show Pathway Hole Report

Reconstitution des voies métaboliques chez C. arsenoxydans

Page 22: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Résistance à l’arsenic …

Arsenite oxydase

aoxCBA

ABC transporters (pts)

2-component reg. systatoC

Acetoacetatemetabolism

lipoprotein Arsenical resistance

arsR-like

arsC-like

arsCArsenatereductase

arsB

Arsenicalpump

Page 23: Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Rôle de l’AGC dans le cadre du GDR arsenic

Construction de la base thématique ArseniScope:

Génomes de C. arsenoxydans et de Thiomonas spp. Intégration à MaGe d’autres génomes très proches en cours de séquençage ? Calculs des synténies et régions uniques Mise en place des bases BioCyc

Assitance à l’annotation experte des génomes

Organisation d’une formation à MaGe Support continu aux annotateurs

Métagénomique (arsenic) Modification de MaGe pour la gestion et l’annotation de ‘métagénome’ Création de catalogues de gènes et de familles de protéine

Bases de données multigénomes

Construction de bases GenoList (Antoine D., I. Moszer) Interface d’interrogation et de navigation dans les bases thématiques

multigénomes (PkGDB)